Pull to refresh
9
0

Ai, Data-science

Send message

Улучшаем генеративных чатботов на нейросети ruGPT3: умный ранжировщик ответов

Reading time 16 min
Views 6K

Нейронные сети все прочнее входят в нашу жизнь. В последнее время особую значимость приобретают исследования, связанные с обучением искусственных нейронных сетей в сфере анализа естественного языка (NLP, NLU) для создания реалистичных, человечных разговорных «скиллов». Одним из первых примеров «человечных» диалоговых решений стала Xiaoice от Microsoft, которая обладала навыками дружелюбности. Позже такие компании как Яндекс, Google [1], Mail.ru и другие выпустили на рынок своих голосовых помощников. Однако все они столкнулись с фундаментальной проблемой: их решения хорошо выполняют запросы пользователей, связанные с четкими командами («расскажи новости»), но совершенно не обладают человечными способностями, качествами характера, эмуляцией чувств, эмпатией и поэтому не способны поддерживать человеческий разговор на различные темы. При этом «видимость человечности» часто обеспечивается набором шаблонных фраз и шуток, подходящих практически в любой ситуации (неспецифичных контексту разговора).

В этой статье мы покажем, как устроен и как работает разработанный нами умный Ранжировщик ответов для нейросеток Трансформер и какой эффект он оказывает на качество разговора любых генеративных чатботов.

Читать далее
Total votes 3: ↑3 and ↓0 +3
Comments 11

Анализ Вконтакте на примере книжных предпочтений участников культурных сообществ

Reading time 7 min
Views 59K

Рис.  3. – Книги каких авторов из рейтинга топ100 читают пользователи Вконтакте

Для всех диаграмм в статье есть интерактивные визуализации: graphgrail.com/gg-client/vk_books.html
К 2014 году потенциал традиционных подходов к развитию аналитики социальных процессов оказался исчерпан в силу нескольких причин, главная из которых – неспособность созданных в рамках данных подходов решений адаптироваться к изменившимся условиям формирования общественных законов. Речь идет об их недостаточной динамичности и неприспособленности для обработки данных, поступающих в больших объемах в режиме времени, близком к реальному. Но самый серьезный удар по классической аналитике нанес взрывной рост объемов неструктурированных данных. [1]
Читать дальше →
Total votes 32: ↑23 and ↓9 +14
Comments 71

Обработка естественного языка в задаче мониторинга предвыборной агитации

Reading time 13 min
Views 9K
В данной статье мы рассмотрим процесс разработки методики контроля предвыборной агитации в Ростовском региональном сегменте Интернет-СМИ с использованием обработки естественного языка и машинного обучения.
Также я остановлюсь на особенностях и нюансах, ведь задача стояла довольно специализированная: необходимо было выделять агитацию, и, если она может нарушать закон — оперативно уведомлять Избирком. Забегая вперед скажу, что с задачей я успешно справился.

В задаче разработки методики контроля предвыборной агитации в Ростовском региональном сегменте Интернет-СМИ применяются наработки из нескольких смежных областей знаний:
  • автоматизированная обработка текстов (текстмайнинг),
  • обработка естественного языка,
  • машинное обучение.

Читать дальше →
Total votes 16: ↑9 and ↓7 +2
Comments 4

Эксперт ООН призвал мировое сообщество притормозить создание боевых роботов с искусственным интеллектом

Reading time 1 min
Views 58K
В Совете ООН по правам человека предложили временно запретить производство боевых автономных роботов, способных самостоятельно принимать решение об уничтожении живых мишеней. Эксперты уверены, что если не сдерживать развитие подобных технологий, то через 30 лет стоит ожидать гибели множества людей от рук «немного сбившихся в один момент с программы роботов».

В четверг спецдокладчик ООН по вопросу о внесудебных казнях, казнях без надлежащего судебного разбирательства или произвольных казнях Кристоф Хайнс призвал ввести повсеместный мораторий на производство летальных автономных роботизированных систем (Lethal autonomous robotics – LARS).

«Есть шагающие роботы, в том числе двуногие, очень похожие на человека. Они могут взять обычную винтовку М-16 и убивать. Это уже реальность»
Читать дальше →
Total votes 57: ↑44 and ↓13 +31
Comments 85

Google запустил сервис передачи запахов онлайн

Reading time 1 min
Views 76K

Поиск на новом уровне ощущений

Информация, затрагивающая ваши чувства: то, что раньше можно было выразить лишь словами, теперь доступно на уровне ощущений.
Ваш интернет-сомелье: примеры запахов дополнены искусно подобранными фотографиями и описаниями.
Мир обоняния: в Коллекции запахов Google хранится более 15 млн аромабайт информации.
Безопасный поиск: фильтрация неприятных запахов.

Google Нос Бета – это самые передовые на сегодняшний день технологии передачи обонятельных ощущений.
Специально оборудованные автомобили Google, записывающие Запах улиц в разных уголках мира.
Мобильное приложение Детектор запахов для последней версии операционной системы Android.
Читать дальше →
Total votes 70: ↑29 and ↓41 -12
Comments 25

Будущее майнинга биткоин на устройствах ASIC (рассуждение)

Reading time 3 min
Views 146K
Наверняка вы уже слышали о грядущей революции в майнинге биткоинов: разработаны специальные чипы, способные радикально повысить его скорость: вместо в лучшем случае 700Мх на видеокарте можно получить 40-60 Гх и «зарабатывать» по $3000-4000 в месяц. Кто не слышал, вот один из пруфов bitcoinmagazine.com/working-avalon-asic-confirmed


Читать дальше →
Total votes 24: ↑9 and ↓15 -6
Comments 63

Визуализация графа социальной сети: анализ событий блогосферы перед декабрём 2011 года

Reading time 6 min
Views 35K
Это логическое продолжение статьи "Построение графа социальной сети с помощью Drupal и Feeds"

Я в составе группы занимался собором информации из блогосферы. Задачей было оценить напряженность, активность политических дискуссий в период избирательной кампании выборов в Государственную Думу. Забегая вперед скажу, что исследование позволило выдвинуть гипотезы, которые позже подтвердились. В частности, по результатам, о которых вы прочтете ниже можно понять, кто же будет выходить на площади и выводить за собой людей. И главное, за кем они пойдут.
Читать дальше →
Total votes 46: ↑38 and ↓8 +30
Comments 16

Отзыв на книгу «Код Дурова» Н. Кононова

Reading time 3 min
Views 44K
Disclaimer: может быть немного спойлеров, постараюсь это делать по минимуму.

Я в восхищении. Автору удалось добиться того, для чего пишутся такие книги — показать элитарность нового поколения предпринимателей. Однозначно точно: школьникам и студентам, вдруг оторвавшимся от Вконтакте и прочитавшим книгу захочется стать такими, как Дуров.
Понравился слог, очень похоже на стиль Пелевина. Постараюсь этот краткий обзор написать в таком же витиеватом стиле).
Читать дальше →
Total votes 146: ↑51 and ↓95 -44
Comments 60

Построение графа социальной сети с помощью Drupal и Feeds

Reading time 3 min
Views 15K
В одном крупном университете на Юге России я разрабатываю программную платформу автоматизированного построения графа социальной сети при помощи обработки интернет страниц социальных сетей. В данной статье я расскажу, как мы обрабатывали данные, собранные из Живого журнала (Livejournal.com).
Прошел почти год, я думаю, будет интересно узнать, как система применялась для автоматизированного сбора данных в период избирательной кампании в Государственную думу в 2011 году.
Читать дальше →
Total votes 17: ↑10 and ↓7 +3
Comments 13

Information

Rating
5,070-th
Location
Россия
Registered
Activity