Pull to refresh
2
0
Рабчевский Евгений @rabchevsky

User

Send message

Новый аукцион в Яндекс Директ: 3 изменения и как их использовать

Reading time7 min
Views12K


В конце августа Яндекс Директ переходит на новый тип аукциона VCG. Действующая схема «второй цены» останется в прошлом. Для кого-то это апокалипсис, а для кого-то светлое будущее. В чем суть изменений, что принесут новые правила и как их использовать с максимальной выгодой — читайте в этой статье.
Читать дальше →
Total votes 9: ↑8 and ↓1+7
Comments5

Идеальная презентация для стартапа: 3 минуты 44 секунды на убеждение инвесторов

Reading time7 min
Views121K
Создание компании — это крайне нелегкий процесс. Привлечение капитала является важным шагом для многих ИТ-стартапов, который, однако, связан с трудностями для тех, кто делает это в первый раз. Учитывая это, мы хотели бы пролить свет на то, что из себя представляет процесс успешного привлечения посевного финансирования.

Читать дальше →
Total votes 16: ↑15 and ↓1+14
Comments1

Насколько ваша команда соответствует принципам agile? Пять вопросов для проверки

Reading time5 min
Views19K


Такие гибкие методологии, как Lean Startup и Scrum, помогут вам понять, чего хотят клиенты, и как им поскорее это дать. Сильнейшие Agile-команды следуют пяти основным паттернам. Чтобы понять, соответствуют ли ваши рабочие процессы принципам Agile, проверьте, насколько вы следуете этим паттернам. Чтобы оставаться гибкими, следуйте этим паттернам постоянно.
Читать дальше →
Total votes 12: ↑12 and ↓0+12
Comments5

Как стартапу получить поддержку большой компании — наш путь к дружбе с Mail.Ru Group

Reading time5 min
Views3K


Случается, что вы выводите стартап на рынок, которого еще нет. Люди пока не знают о проблеме, которую вы решаете или не считают её серьезной. Рекламировать продукт в такой обстановке — зря тратить время. Маловероятно, что все вдруг осознают важность проблемы, с которой ваш стартап справляется, наверняка, лучше всех и побегут к вам покупать решение.

Процесс будет постепенным. Со временем образуется понятный рынок, появятся основные игроки, устоятся цены. Но нельзя ждать, пока все сложится само собой. Ведь если даже имея лучшее на сегодня решение сидеть неподвижно — чуда не случится и вы останетесь у обочины нового рынка.

Наступает время занимать стратегическую позицию на будущем рынке. Задача, которую вам придется для этого решить крайне сложна, но предельно понятна. Нужно донести до людей осознание серьезности проблемы, с которой работает ваш стартап. Для этого есть всего два пути: либо потратить миллионы на работу со СМИ, либо попробовать найти поддержку ваших идей в лице известной и авторитетной компании. Давайте смотреть правде в глаза. Маловероятно, что вы сможете привлечь сотни миллионов инвестиций в ваш стартап для глобальной PR-кампании и создания нового рынка. Остается только надежда на партнера, который сможет донести серьезность и значимость решаемой вами проблемы до людей.

Я расскажу, что вы сами можете сделать уже сейчас, чтобы занять выгодную стратегическую позицию на будущем рынке. И покажу это на примере того, как у нас, еще молодого стартапа, получилось создать совместный с Mail.Ru Group сервис по проверке сайтов на вирусы, который сейчас работает с более чем 1 миллионом сайтов. Итак, пора действовать.

Читать дальше
Total votes 13: ↑7 and ↓6+1
Comments2

Text Analytics as Commodity: обзор приложений текстовой аналитики

Reading time11 min
Views17K
text analytics landscapeЕсли бы мне дали миллиард долларов на научные исследования, я бы создал большую программу в масштабе NASA по обработке естественного языка (NLP).[из Reddit AMA Майкла Джордана, 2015]. Из данной публикации вы узнаете, есть ли рынок для приложений текстовой аналитики. И не слишком ли оптимистичен заслуженный профессор М. Джордан по поводу потенциала NLP, а лучше потратить миллиард долларов на что-то другое.

Введение


Вначале определимся с терминами. Интеллектуальный анализ текста (англ., text mining) — это технологии получения структурированной информации из коллекций текстовых документов. Обычно в это понятие включают такие крупные задачи, как
  • категоризация текста
  • извлечение информации
  • информационный поиск.

Часто, когда говорят о применении интеллектуального анализа текста в бизнесе — текстовой аналитики (англ., text analytics) — имеют в виду не просто структурированную информацию, а т.н. углубленное понимание предмета анализа (insights), которое помогает в принятии бизнес-решений. Известный эксперт Сэт Граймс определяет текстовую аналитику как технологические и бизнес процессы применения алгоритмических подходов к обработке и извлечению информации из текста и получению глубокого понимания.

Принято считать, что формируется новый рынок когнитивно-вычислительных (cognitive computing) продуктов. По оценкам MarketsandMarkets глобальный рынок продуктов на основе обработки естественного языка должен составить $13.4 млрд. к 2020 году при росте в 18.4% по CAGR. Таким образом, сейчас этот рынок оценивается примерно в $5.8 млрд. В последние годы этот растущий рынок ознаменовался целым рядом громких сделок, вроде покупки Alchemy API компанией IBM. По другим оценкам, аналогичный рынок в Европе уже сейчас превосходит пол-миллиарда долларов и удвоится к 2019 году. Рынок Северной Америки составляет почти 40% глобального рынка текстовой аналитики и имеет оптимистичные оценки роста.
Читать дальше →
Total votes 6: ↑6 and ↓0+6
Comments2

Palantir, мафия PayPal, спецслужбы, мировое правительство

Reading time8 min
Views71K
«Лучший способ избавиться от дракона — это иметь своего собственного»



На Хабре нет ни одного упоминания о Palantir`е, в русской Википедии об этом проекте нет статьи, Mithgol молчит — что-то идет не так. Или так.

А между тем Palantir стала второй крупнейшей частной компанией Кремниевой Долины с оценкой в 20 000 000 000$ (уступив Uber). Среди прочих заслуг Palantir`а — раскрытие крупных китайских разведывательных операций Ghostnet и Shadow Network.
Журналист: — В «Википедии» говорится, что вы входите в управляющий комитет Бильдербергского клуба. Правда ли это, и если да, чем вы там занимаетесь? Организуете тайное мировое господство?

Питер Тиль: — Это правда, хотя все не до такой степени тайно или секретно, чтобы я не мог вам рассказать. Суть в том, что ведется хороший диалог между разными политическими, финансовыми, медиа- и бизнес-лидерами Америки и Западной Европы. Никакого заговора нет. И это проблема нашего общества. Нет секретного плана. У наших лидеров нет секретного плана, как решить все наши проблемы. Возможно, секретные планы – это и плохо, но гораздо возмутительнее, по-моему, отсутствие плана в принципе.

Приходится собирать информацию о Palantir`е по крохам. И такая жирная кроха прячется в книге Питера Тиля «От нуля к единице» (хотя в этой книге множество намеков и информации между строк, так же как в легендарном курсе и его переводе на Хабре, спасибо zag2art).

Питер Тиль: Цель, которую я ставил перед собой, читая стэнфордский курс о стартапах и предпринимательстве, заключалась в том, чтобы донести все те знания о бизнесе, которые я приобрел за последние 15 лет в Кремниевой долине как инвестор и предприниматель, собрать их воедино. С книгой то же самое.

Надеюсь, благодаря этой статье и комментам хабрачитателей, положение дел относительно Palantir`а станет чуточку яснее.
(Есть многомиллиардный рынок, связанный с аналитикой и ИБ, а мы ничего про него не знаем.)
Читать дальше →
Total votes 56: ↑44 and ↓12+32
Comments22

Молодому учёному из Краснодара грозит 11 лет строгого режима

Reading time2 min
Views177K

Фото: Владимир Аносов/РГ

По-настоящему трагическая история произошла с 26-летним кубанским учёным Дмитрием Лопатиным. Он изобрёл гибкие солнечные фотоэлементы новой конструкции с использованием перовскита вместо кремния, которые эффективно работают даже на закате, в облачную погоду и в туман. При этом они в пять раз дешевле в производстве, чем обычные фотоэлементы.

Но в процессе разработки Дмитрий заказал по почте один литр растворителя гамма-бутиролактон, который, как позже выяснилось, является ещё и психотропным веществом.
Читать дальше →
Total votes 190: ↑180 and ↓10+170
Comments593

Анализ тональности в социальных медиа на русском языке при помощи RussianSentimentAnalyzer API

Reading time2 min
Views11K
В этом посте я покажу, как воспользоваться API анализа тональности в социальных медиа на русском языке. Одной из отличительных фич системы является возможность определять тональность по отношению к заданному объекту мониторинга. Проиллюстрирую на примере:

Мне нравится телефон X, но телефон Y ужасен.

Читать дальше →
Total votes 17: ↑13 and ↓4+9
Comments18

Иерархическая классификация сайтов на Python

Reading time8 min
Views27K
Привет, Хабр! Как упоминалось в прошлой статье, немаловажной частью нашей работы является сегментация пользователей. Как же мы это делаем? Наша система видит пользователей как уникальные идентификаторы cookies, которые им присваиваем мы или наши поставщики данных. Выглядит этот id, например, так:

42bcfae8-2ecc-438f-9e0b-841575de7479

Эти номера выступают ключами в различных таблицах, но первоначальным value является, в первую очередь, URL страниц, на которых данная кука была загружена, поисковые запросы, а также иногда некоторая дополнительная информация, которую даёт поставщик – IP-адрес, timestamp, информация о клиенте и прочее. Эти данные довольно неоднородные, поэтому наибольшую ценность для сегментации представляет именно URL. Создавая новый сегмент, аналитик указывает некоторый список адресов, и если какая-то кука засветится на одной из этих страничек, то она попадает в соответствующий сегмент. Получается, что чуть ли не 90% рабочего времени таких аналитиков уходит на то, чтобы подобрать подходящий набор урлов – в результате кропотливой работы с поисковиками, Yandex.Wordstat и другими инструментами.
logo
Получив таким образом более тысячи сегментов, мы поняли, что этот процесс нужно максимально автоматизировать и упростить, при этом иметь возможность мониторинга качества алгоритмов и предоставить аналитикам удобный интерфейс для работы с новым инструментом. Под катом я расскажу, как мы решаем эти задачи.
Читать дальше →
Total votes 36: ↑36 and ↓0+36
Comments18

Потоковая обработка данных при помощи Akka

Reading time5 min
Views39K
Привет, Хабр! Все привыкли ассоциировать обработку больших данных с Hadoop (или Spark), которые реализуют парадигму MapReduce (или его расширения). В этой статье я расскажу о недостатках MapReduce, о том, почему мы приняли решение отказываться от MapReduce, и как мы приспособили Akka + Akka Cluster на замену MapReduce.


Читать дальше →
Total votes 47: ↑44 and ↓3+41
Comments50

Команды и их типология. Как построить самоорганизующуюся команду?

Reading time7 min
Views23K


Бизнес, в котором все идет по плану, а сотрудники решают поставленные перед ними задачи и успешно обходят все проблемы без вовлечения руководства – идеал, к которому стремятся многие компании. Сегодня мы поговорим о том, как всего этого можно добиться.
Читать дальше →
Total votes 15: ↑14 and ↓1+13
Comments0

Кейс: Как организовать работу над интернет-проектом в Trello

Reading time4 min
Views18K
image

Привет, меня зовут Дима. Хочу поделиться с вами опытом работы над сервисом Carrot Quest (ссылка на описание проекта на Мегамозге). Это сервис для общения и управления пользователями на основе их поведения, другими словами marketing automation.

Долго мы искали для себя удобную форму работы и сколько перепробовали различных инструментов: использовали сервис Asana, работали со Scrum-досками, даже в Google Docs умудрялись записывать задачи. Мы постоянно искали удобную для всей команды методологию.
Читать дальше →
Total votes 19: ↑14 and ↓5+9
Comments2

Социальные сети в России, весна 2015. Цифры, тренды, прогнозы

Reading time8 min
Views7.8K
Представляем новые данные исследования цикла «Социальные сети в России сегодня: цифры, тренды, прогнозы», за первое полугодие 2015 г. Шестая регулярная публикация содержит актуальные данные о проникновении социальных медиа по регионам России, демографический анализ аудитории, а также динамику публикационной активности в социальных сетях.
Читать дальше →
Total votes 11: ↑11 and ↓0+11
Comments1

Минкомсвязи против ответственности за «лайки» и репосты

Reading time2 min
Views7.9K
Представитель Минкомсвязи РФ в эфире радиостанции «Эхо Москвы» рассказал, что министерство выступает против ответственности за лайки и репосты в социальных сетях. Замминистра отметил, что понятия «репост» и «перепост» прописаны нечётко, и что в некоторых случаях пользователь может дать ссылку на контент, который после этого будет заменен противоправным.
Читать дальше →
Total votes 23: ↑22 and ↓1+21
Comments3

Психология ценообразования: 10 стратегий и 29 тактик

Reading time30 min
Views63K


Добро пожаловать! Это длинный список стратегий ценообразования, учитывающих психологические факторы.

Неважно, запускаете ли вы новый продукт, продаете что-либо на eBay или же заключаете сделку о продаже дома – вы научитесь устанавливать цены, которые максимизируют вашу прибыль.
Читать дальше →
Total votes 30: ↑28 and ↓2+26
Comments5

Сериал: Big Data — как мечта. 9-я серия: Почему IBM был вынужден купить «Алхимиков» за $100млн

Reading time4 min
Views3.9K
В предыдущих сериях: Big Data — это не просто много данных. Big Data — процесс с положительной обратной связью. «Кнопка Обамы» как воплощение rtBD&A. Философия развития Big Data. В этой серии поговорим о лингво-аналитике высокоскоростных потоков неструктурированных текстов и сообщений соцмедиа и представим «Эврику» — наш ответ «Алхимикам».

Интернет, в своем нынешнем восприятии обществом, это связанный набор сообщений: личной переписки в мессенджерах, ссылки между статьями в СМИ, обсуждений в блогах, игровые чаты, тематические сериалы на Хабре, или, как преобразилось в мировоззрении новых поколений — ссылки на ответы поисковика после набора запроса «Чем сегодня заняться?»

Если приглядеться, то основа основ: Связи и Тематики. Про аналитику «связей» говорить не будем (это к АНБ, на чьи возможности по электронной слежке сегодня отказался покушаться даже «всемогущий Сенат США»). А вот Тематическая аналитика (что недавно получило свое название — Brand Analytics — в пресс-релизе между Facebook и DataSift, а в России существует уже 3 года в виде названия проекта) и связанные с ней разнообразные вкусности — прекрасная тема (! :-) ) для новой серии.
Читать дальше →
Total votes 11: ↑6 and ↓5+1
Comments0

Россия и Китай подпишут соглашение о сотрудничестве в области информационной безопасности

Reading time2 min
Views4.4K
В ходе визита в Москву председателя КНР Си Цзиньпина 8 мая может быть подписан проект межправительственного соглашения между двумя странами о совместном противодействии киберугрозам. В рамках проекта Россия и Китай не будут атаковать друг друга и будут сотрудничать для противодействия использованию технологий для «вмешательства во внутренние дела государств» и «дестабилизации внутриполитической и социально-экономической обстановки», пишет Коммерсант.
Читать дальше →
Total votes 14: ↑13 and ↓1+12
Comments5

Соцсеть LinkedIn помогла «засветить» 27000 работников разведслужб США

Reading time1 min
Views19K


Социальные сети — зло, особенно для людей, которые заняты в разного рода службах разведки. На днях в Сети появился сервис Transparency Toolkit, который, по словам разработчиков, содержит информацию о 27 тысячах работников разведслужб США. При этом базу набирали не благодаря каким-то утечкам информации из этих организаций. Разработчики сервиса просто детально проанализировали базу данных LinkedIn, стараясь выявлять работников разведслужб по разного рода секретным кодовым словам (правда, некоторые из них известны определенным кругам специалистов) и некоторым другим параметрам. Некоторые пользователи LinkedIn открыто публикуют название конторы, на которую они работают.
Читать дальше →
Total votes 28: ↑25 and ↓3+22
Comments8

Компьютеры на базе процессоров Эльбрус-4С стали доступны для покупки юридическими лицами

Reading time2 min
Views49K
image
Свершилось, господа: 23 апреля 2015 года ЗАО «МЦСТ» и ПАО «ИНЭУМ им. И.С.Брука» сообщили, что пополняют ассортимент продукции новыми моделями вычислительных комплексов: персональным компьютером АРМ Эльбрус-401 и сервером Эльбрус-4.4, и что на опытные образцы этих систем открыт приём заказов по электронной почте и телефону. Контакты можно узнать на официальном сайте ЗАО «МЦСТ», но заказы принимаются только от юридических лиц.
Читать дальше →
Total votes 65: ↑58 and ↓7+51
Comments273

Извлечение упоминаний сущностей и поиск в Textocat API

Reading time9 min
Views17K
Textocat API — это облачный SaaS анализа текстов. Качественное извлечение полезной информации из текстов — сложная задача и требует серьезной экспертизы. Миссия команды Textocat — сделать процесс обработки текстов настолько легким для использования, чтобы его мог включить в свой арсенал любой современный разработчик. Используя Textocat API, вы можете быстро прототипировать приложения на основе текстовой аналитики и превращать их в свой бизнес. В данной публикации мы покажем, насколько легко интегрировать в любое приложение возможности Textocat API по распознаванию упоминаний сущностей (объектов) и поиску документов на русском языке.

Возможности Textocat API Beta


В начале апреля мы запустили бета-тестирование Textocat API. В этой версии мы предлагаем разработчикам бесплатно использовать часть функционала сервиса со следующими возможностями:
  • распознавание упоминаний сущностей (entity recognition) в коллекциях документов на русском языке;
  • хранение обработанных коллекций;
  • полнотекстовый поиск с учетом выделенных типов сущностей.


пример распознавания упоминаний сущностей

Читать дальше →
Total votes 24: ↑23 and ↓1+22
Comments66

Information

Rating
Does not participate
Location
Пермь, Пермский край, Россия
Date of birth
Registered
Activity