Как стать автором
Обновить

Запросы к Twitter API на синтаксисе SQL

Время на прочтение 1 мин
Количество просмотров 1.5K
Язык запросов TweeQL сделан по образцу SQL-синтаксиса и позволяет работать с базой твитов так же просто, как с реляционной базой данных.

TweeQL имеет следующий синтаксис:

SELECT field1, field2 FROM streams WHERE filter_conditions GROUP BY field3, field4 WINDOW x seconds

Например, запрос вида

SELECT text FROM twitter_sample WHERE text contains 'bobuk'; 

просто вытягивает из потока твитов те фрагменты, в которых упоминается 'bobuk' (bobuk здесь просто ради примера как самый активный пользователь Twitter API в Рунете).

Всё это без необходимости думать о всех деталях для правильного API-запроса.

TWITTER_SAMPLE — это поток твитов, который содержит примерно 1% от общего их числа. Если нужно делать запросы к общему потоку, указывайте в качестве источника данных TWITTER.

Отфильтрованные твиты можно сохранять в базу данных на локальном диске (её параметры задаются в settings.py). По причинам производительности запись в базу данных осуществляется только при достижении 1000 записей, так что если отфильтрованных записей меньше — они не сохранятся.

TweeQL закодирован на Python.
Теги:
Хабы:
+30
Комментарии 34
Комментарии Комментарии 34

Публикации

Истории

Ближайшие события

Московский туристический хакатон
Дата 23 марта – 7 апреля
Место
Москва Онлайн
Геймтон «DatsEdenSpace» от DatsTeam
Дата 5 – 6 апреля
Время 17:00 – 20:00
Место
Онлайн