Народ, расслабтесь! Это не телефон в подарок, это просто служебный телефон бесплатно. Когда увольняешься то надо отдать назад. До настоящего момента в яху выдавали блекбери, многие не хотели их брать и практически 80% ходит со своими телефонами.
Конечно, это хорошая новость, в любом случае. Мариса молодец.
вы товарищ cL1Nk3r, не беспокойтесь. Если вас повезут и квартиру вам снимут на первое время и машину дадут. И прочую помощь окажут, всё ж 21век на дворе. Тут скорее надо беспокоится, понравится ли жене…
Я не TC, но задача представляется мне достаточно тривиальной.
Берем готовый crawler например Nutch или пишем свой. Вставляем все документы в Solr (это http server вокруг lucene). Он строит индекс. Запросы поисковые шлем в Solr, документы если надо их хранить, вытаскиваем из какого-то хранилища отдельно. При небольшой нагрузке — скажем сотни сайтов + глубина ссылок 2-3 + refresh interval 24h+
работать будет нормально.
Что будет сложно сделать хорошо — так это классификация контента. Но если опять же — сайтов не много, язык один, можно просто по ключевым словам — руками создали словарь для всех рубрик, и если их много — значит скажем про «космос». Возможно где-то есть бесплатная качественная библиотека для этого, но мне она не знакома.
Можно купить, есть коммерческие предложения.
Яху окучивает поле display advertising. Реклама вокруг новостей и другого развлекательного контента. Раньше еще была поисковая реклама но после того как все отдали майкрософту выхлоп там никакой. С гуглом пересечение есть только в поисковой рекламе.
вот ещё довольно удобный способ.
пре-генерация id в базе наперёд блоками и кеширование этого блока на клиенте. Скажем, если вставляется 10 записей — один запрос на генерацию 1000 ids. 10 используются сразу, а 990 ждут следующего раза.
Для генерации используюется стандартная hi-lo процедура
это точно про канаду. Я живу на юге, в самом населенном месте, но если отъехать всего километров на 500 на север — тишь и глушь. Леса где нога человека не ступала и всё такое. Если отъехать на 1000, можно быть единственным на 100 км в любую сторону. И всё равно оставаться примерно на широте Киева.
там не в разговорах проблема, а в сообщениях которые через Blackberry Internet Service (BIS) передаются.
Разговоры вот как раз слушать не проблема, как я понимаю, они прямо на коммутаторе провайдера слушаются.
Трафик который идёт через BIS довольно слабо зашифрован, у BES можно гораздо сильнее шифрование включить, так что не совсем ясен зачем такой кипеж.
BIS трафик это примерно так —
телефон — вышка — BIS сервер у провайдера — BB Relay — интернет
Саудовцы хотели что бы им дали ключи от BB Relay, а таких дата-центров всего ничего на весь мир — неудивительно, что им отказали, всю северную америку обслуживает один датацентр в Waterloo, ON
> pubsubhubbub никогда не заменит поллинг
может быть уже скоро заменит, трудно сказать — но вот вам такая статистика
feedburner (google) поддерживает pubsubhubbub
из 800ооо RSS фидов на нашем проекте (viigo.com) 25% были с feedburner
т.е. как минимум 25% уже покрыты.
Там кроме feedburner есть и другие крупные компании — так что я думаю что доля ещё больше и бужет расти
любопытно — а почему XMPP/ICQ/etc более надежный транспорт чем e-mail?
я всю жизнь считал что наоборот. Письмо и на телефон прийдёт, и на десктоп или ещё куда.
А IM легко потеряться.
Конечно, это хорошая новость, в любом случае. Мариса молодец.
Берем готовый crawler например Nutch или пишем свой. Вставляем все документы в Solr (это http server вокруг lucene). Он строит индекс. Запросы поисковые шлем в Solr, документы если надо их хранить, вытаскиваем из какого-то хранилища отдельно. При небольшой нагрузке — скажем сотни сайтов + глубина ссылок 2-3 + refresh interval 24h+
работать будет нормально.
Что будет сложно сделать хорошо — так это классификация контента. Но если опять же — сайтов не много, язык один, можно просто по ключевым словам — руками создали словарь для всех рубрик, и если их много — значит скажем про «космос». Возможно где-то есть бесплатная качественная библиотека для этого, но мне она не знакома.
Можно купить, есть коммерческие предложения.
пре-генерация id в базе наперёд блоками и кеширование этого блока на клиенте. Скажем, если вставляется 10 записей — один запрос на генерацию 1000 ids. 10 используются сразу, а 990 ждут следующего раза.
Для генерации используюется стандартная hi-lo процедура
www.microsoft.com/ru-ru/events/msqadays/index.html
но там все равно не написанно как послушать/посмотреть онлайн-трансляцию. Она доступна только платным участникам?
Разговоры вот как раз слушать не проблема, как я понимаю, они прямо на коммутаторе провайдера слушаются.
Трафик который идёт через BIS довольно слабо зашифрован, у BES можно гораздо сильнее шифрование включить, так что не совсем ясен зачем такой кипеж.
BIS трафик это примерно так —
телефон — вышка — BIS сервер у провайдера — BB Relay — интернет
Саудовцы хотели что бы им дали ключи от BB Relay, а таких дата-центров всего ничего на весь мир — неудивительно, что им отказали, всю северную америку обслуживает один датацентр в Waterloo, ON
может быть уже скоро заменит, трудно сказать — но вот вам такая статистика
feedburner (google) поддерживает pubsubhubbub
из 800ооо RSS фидов на нашем проекте (viigo.com) 25% были с feedburner
т.е. как минимум 25% уже покрыты.
Там кроме feedburner есть и другие крупные компании — так что я думаю что доля ещё больше и бужет расти
я всю жизнь считал что наоборот. Письмо и на телефон прийдёт, и на десктоп или ещё куда.
А IM легко потеряться.