Pull to refresh
0
0
Tony Realovich @realovich

User

Az.js: JavaScript-библиотека для обработки текстов на русском языке

Reading time 8 min
Views 28K
Как чуден и глубок русский курлык
Генератор постов

Обработка естественного языка (natural language processing, NLP) — тема, на мой взгляд, очень интересная. Во-первых, задачи тут чисто алгоритмические: на вход принимаем совершенно примитивный объект, строчку, а извлечь пытаемся вложенный в него смысл (ну или хотя бы частичку смысла). Во-вторых, необязательно быть профессиональным лингвистом, чтобы решать эти задачи: достаточно знать родной язык на более-менее приличном уровне и любить его.

А ещё с небольшими затратами можно сделать какого-нибудь бестолкового чат-бота — или, как вот я, генератор постов на основе того, что вы писали на своей страничке в соцсети. Возможно, кто-то из вас уже видел это приложение — оно довольно глупое, чаще всего выдает бессмысленный и бессвязный текст, но изредка всё же дает повод улыбнуться.

Бессвязность текстов в нынешней версии «Генератора» вызвана тем, что на самом деле никакого анализа он производить не умеет. Просто в одних случаях «предсказывает» продолжение предложения по собранным биграммам, а в других — заменяет в готовом предложении некоторые слова на другие, которые заканчиваются похоже. Вот и вся начинка.

Конечно, хочется сделать что-нибудь поинтереснее. Беда в том, что модные сейчас нейросети не очень-то применимы здесь: им нужно много ресурсов, большую обучающую выборку, а в браузере у пользователя соцсети всего этого нет. Поэтому я решил изучить вопрос работы с текстами с помощью алгоритмов. К сожалению, готовых инструментов для работы с русским языком на JavaScript найти не удалось, и я решил сделать свой маленький велосипед.
Читать дальше →
Total votes 54: ↑54 and ↓0 +54
Comments 30

Два по сто: самые читаемые статьи и авторы Хабра и ГТ

Reading time 10 min
Views 66K
Если кто не знает, на Хабре, как и Гиктаймсе, всегда можно посмотреть все самые рейтинговые статьи за всё время. Но по просмотрам ни статьи, ни авторы никак не сортируются. Список ниже отражает почти полную правду о самых читаемых статьях «Хабра» и «Гиктаймса» за всё время. Почти — потому что, к сожалению, публичный счётчик был включён только 27 сентября 2012 года (примерная дата), поэтому если вам кажется, что какие-то ваши любимые тексты эпохи, когда Хабр был более торт, недосчитались просмотров — может, вы и правы. Впрочем, отчасти фактор неработавшего ранее счётчика нивелируется мощным хвостом в виде поискового траффика, так что действительно сильные тексты в любом случае должны были получить то, что им причитается — но об этом позже.

Итак, самые топ-100 самых читаемых постов за всё время на Хабре и ГТ в сумме. Megamozg included by default, т.к. данные собраны 21 мая, уже после обратного слияния с «Хабром»:

  1. «Скрытые смайлы в Skype», G0rDi — 1599K (2009)
  2. «Взломать Wi-Fi за… 3 секунды», ushanov90 — 1511K (2012)
  3. «Взломать Wi-Fi за 10 часов», gorl — 1181K (2012)
  4. «300 потрясающих бесплатных сервисов», shimapa23 — 1052K (2015)
  5. «Пишем своё первое приложение на Android», Hoorsh — 997K (2010)
  6. «Обновление с Windows 7/8.1 до Windows 10 TP через Windows Update», akibkalo — 840K (2015)
  7. «Простая стратегия игры 2048», WhatIsGTO — 820K (2014)
  8. «Откровенные фото Дженнифер Лоуренс и еще десятков знаменитостей утекли через iCloud», Akr0n — 795K (2014)
  9. «Подарок от Skype на новый год», gmikhail94 — 781K (2013)
  10. «Wi-Fi: неочевидные нюансы (на примере домашней сети)», apcsb — 757K (2012)

Читать дальше →
Total votes 60: ↑60 and ↓0 +60
Comments 66

How-to: Правила вёрстки email-писем

Reading time 16 min
Views 183K


Электронная почта — отличный инструмент коммуникации, который позволяет компаниям доставлять аудитории контент удобным для нее способом. При этом читать письма в формате plain text не всегда удобно, поэтому в современных новостных рассылках используются различные графические элементы.

Вёрстка HTML для электронной почты — интересная и довольно сложная задача. Письма должны одинаково хорошо отображаться на старых устройствах и версиях программных клиентов.

В сегодняшней статье мы поговорим о том, как создавать email-письма, которые хорошо выглядят на любых устройствах, а также рассмотрим способы адаптации HTML-кода уже существующих рассылок для их отображения на телефонах и планшетах.

Примечание переводчика: Представленный ниже материал содержит значительное количество технических терминов, при переводе которых могут возникнуть неточности. Если вы заметили опечатку, ошибку или неточность перевода — напишите нам, и мы оперативно всё исправим.
Читать дальше →
Total votes 30: ↑26 and ↓4 +22
Comments 21

Приятная сборка frontend проекта

Reading time 12 min
Views 441K
В этой статье мы подробно разберем процесс сборки фронтенд проекта, который прижился в моей повседневной работе и очень облегчил рутину.

Статья не претендует на истину в последней инстанции, так как сегодня существует большое количество различных сборщиков и подходов к сборке, и каждый выбирает по вкусу. Я лишь поделюсь своими мыслями по этой теме и покажу свой workflow.

UPD (13 марта 2015): Заменил несколько плагинов на более актуальные + решил проблему с импортом CSS файлов внутрь SCSS

Читать дальше →
Total votes 61: ↑53 and ↓8 +45
Comments 119

Верстка email рассылок от А до Я для чайников

Reading time 9 min
Views 402K
Уже 3 с лишним года занимаюсь дизайном и версткой почтовых рассылок, которые ориентированы на англоязычных пользователей. За время работы перелопатили огромную кучу информации, перепробовали много вариантов верстки, набили достаточное количество шишек. Были найдены и исправлены типичные баги, которые в той или иной мере повторялись во всех почтовых клиентах. Также нашлись проблемы с некоторыми CSS свойствами — различные почтовые клиенты интерпретировали их по разному. Каждое письмо тестировалось на самых популярных почтовых клиентах: Gmail, Outlook, Yahoo, Android, iOS, MozillaThunderbird, Microsoft Outlook, The Bat. Рассылки ходят на сотни миллионов пользователей и приносят очень хорошие результаты. Итак, приступим к изучению.
Читать дальше →
Total votes 66: ↑62 and ↓4 +58
Comments 35

15 советов и хитростей инструментов разработчика Chrome, которые вы обязаны знать

Reading time 5 min
Views 203K
Сегодня Google Chrome является самым популярным браузером среди веб разработчиков. С быстрым, шести недельным, циклом релизов и мощным набором постоянно расширяющихся инструментов разработчика, превратившим браузер в инструмент, который вы обязаны иметь. Большинство из вас, вероятно, знакомы со многими его функциями, такими как «живое» редактирование CSS, используя консоль и отладчик. В этой статье мы с вами рассмотрим 15 захватывающих советов и хитростей, которые позволят улучшить вашу производительность еще больше.
Читать дальше →
Total votes 88: ↑85 and ↓3 +82
Comments 23

50+ лучших дополнений к Bootstrap

Reading time 5 min
Views 202K


Благодаря популярности CSS фреймворка Bootstrap, для него разработали массу различных дополнений. Даже сейчас вы можете использовать Bootstrap практически для любой задачи при разработке и оформлении вебсайта.

Для статьи я подобрал наиболее полезные дополнения «на все случаи жизни».
Читать дальше →
Total votes 123: ↑111 and ↓12 +99
Comments 25

Как вернуть деньги со счета мобильного, если вы не подключали сторонних услуг

Reading time 4 min
Views 220K
Если вдруг однажды вы заметите, что с вашего счета начнут утекать деньги в непонятном направлении, эта статья поможет вам разобраться в причинах и, самое главное, вернуть эти деньги.

Disclaimer: хабр не является жалобной книгой, поэтому из статьи был выкинут личный пример «попадания» на описываемое.

Как вообще можно подписать на услугу без моего ведома?


У сотовых операторов есть «партнеры», оказывающие разного рода услуги (например, купить картинку-подарок в «Контакте»). Смысл подобных услуг заключается в следующем:
  1. Вы вводите номер телефона.
  2. Вам присылают код подтверждения.
  3. Вы вводите этот код.
  4. С этого моменты вы считаетесь официально подписанным на какую-то услугу (будь то одноразовую или нет).


Подвох заключается в том, что легитимность подключения какой-либо услуги операторы запрашивают у самих компаний, которые эту услугу подключают (эти компании именуются партнерами сотовых операторов). Более того, отправление уведомления и подтверждения подключения какой-либо услуги лежит полностью на совести партнеров операторов (контент-провайдеров). Интересным также является тот момент, что в биллинге у некоторых сотовых операторов (например, у «Билайна») нет информации по поводу входящих смс, т. е. если вам будут говорить, что вам пришла смс с подверждением, вам не смогут это доказать.

Всё это делает возможным, например, следующую схему:
  1. 1-го января в семь утра вводят ваш номер телефона.
  2. Оператору присылают уведомление, что вы бессрочно подписались на такую-то услугу и подтвердили эту услугу.
  3. С вашего счета начинают списывать 40 р. каждый день, пока не кончатся деньги или вы не заметите их утечку (если вы платите за телефон раз в месяц, то легко можете потерять тысячу рублей).

Читать дальше →
Total votes 70: ↑66 and ↓4 +62
Comments 66

Береги зрение, используй f.lux

Reading time 1 min
Views 447K
Почти четыре года прошло с момента упоминания на Хабре программы f.lux, настоящего лекарства для тех, у кого устают глаза из-за монитора.



Программа изменяет цветовой профиль монитора, в зависимости от времени суток. Ночью глаза меньше устают от тёплых цветовых тонов (3400 K), днём — от холодных (6500 K), которые больше соответствуют дневному свету.
Читать дальше →
Total votes 113: ↑94 and ↓19 +75
Comments 110

Ликвидаторы безграмотности

Reading time 1 min
Views 702
Думаю, что каждый из вас сталкивался с небольшими сайтами, которые не смотря на размер, делают очень важное дело — учат чему-то. При этом всё происходит настолько просто и легко, что после закрытия страницы, ощущаешь приятный зуд в пятках. Я хочу поделиться с вами огромным списком ссылок, но это невозможно, потому как знаю я лишь три подобных сайта.1 Из-за этого я предлагаю вам вступить в диалог и составить реальный список ликвидаторов безграмотности.

UPD: Цель поста — сконденсировать адреса, которые и себе пригодятся и другим можно кинуть вместо фразы «на гугле забанили?»

То, о чём известно мне.
Total votes 44: ↑35 and ↓9 +26
Comments 42

Крик души: давайте писать грамотно!

Reading time 4 min
Views 1.4K
Буквально каждый день я получаю письма и документы со множеством опечаток и ошибок. Это разного рода деловая переписка — договоры, акты, технические задания, сметы, а также письма от клиентов, партнеров и коллег. К сожалению, не обращать внимания на такие «мелочи» постепенно становится нормой.

Отсутствие ошибок правописания в документах — часть делового этикета. И, похоже, самая сложная. Очень непросто добиться беспрекословно грамотного письма, но не допускать элементарные распространенные ошибки в своей «менеджерской лексике» — уже заметный шаг на этом пути.

Читать дальше →
Total votes 115: ↑73 and ↓42 +31
Comments 81

Строение двигателей

Reading time 7 min
Views 128K
Недавно наткнулся на прекрасный сайт (англ.), который по полочкам размусоливает и показывает строение большинства типов двигателей. Попытаюсь вольно и сжато пересказать самое на мой взгляд главное, совсем по пальцам и как для самых маленьких. Конечно можно было бы позаимствовать точные определения из авторитетных источников, но такой любительский перевод обещает быть единственным в своем роде :)

А можете ли Вы сходу объяснить Вашей девушке, в чем отличие бензинового двигателя от дизельного? Четырёхтактного и двухтактного движков? Нет? Тогда приглашаю под кат.

Читать дальше →
Total votes 249: ↑220 and ↓29 +191
Comments 142

Учет затрат на автомобиль в бортовых журналах Drivernotes.net

Reading time 8 min
Views 15K
Привет, Хабрасообщество.

Хочу рассказать вам о нашем онлайн-сервисе бортовых журналов для автомобилей – DriverNotes.net. Надеюсь, что описание нашего ресурса получится не просто в стиле «Я пиарюсь», но и наведет на какие-то мысли людей, только собирающихся создать что-то свое. В любом случае буду рад ответить на все интересующие вас вопросы.

image


Читать дальше
Total votes 64: ↑55 and ↓9 +46
Comments 114

Развитие Интернета: от урезанного dial-up до свободного WiFi

Reading time 10 min
Views 2.5K

Когда-то Интернет влезал в одну дискету


Все мы являемся свидетелями и участниками стремительного развития этого глобального явления. Удивительно, что почти каждый может вспомнить тот момент в своей жизни, когда впервые столкнулся с ним, но не может представить, как можно без него жить, учиться, работать или отдыхать. Думаю, что многие со мной согласятся – Интернет стал частью нашей жизни. Что его ждёт впереди? Для того, чтобы представить будущее, необходимо заглянуть в прошлое и сравнить его с настоящим.

Вспомним, что было всего два десятка лет назад… Мало кто тогда знал об Интернете, если быть точнее — об Internet, так как в русском языке такого слова тогда еще не существовало. Не смотря на то, что уже несколько десятилетий развивались технологии электронной почты, доски объявлений, новостные группы, чаты и т.д., Интернет фактически был «закрытой» для обычных пользователей сетью, развернутой между американскими университетами и военными ведомствами. Сам Интернет не оказывал никакого непосредственного влияния на жизнь людей, и являлся сугубо научной разработкой с военным уклоном. Ни о каком массовом распространении Интернета до появления способов недорогого и универсального доступа в сеть не могло быть и речи.

Ситуация кардинально изменилась с развитием самого распространенного на тот момент коммутируемого удаленного доступа dial-up. Количество тех, кто получил возможность выхода в Интернет начало измеряться десятками миллионов, а ежегодные темпы роста числа новых пользователей увеличились на порядок и, вплоть до сегодняшнего дня, измеряются десятками процентов ежегодно.
Читать дальше →
Total votes 65: ↑43 and ↓22 +21
Comments 62

Вышел релиз популярного магазина OpenCart v1.5.0 RC1

Reading time 2 min
Views 5.8K
Один из самых популярных и динамично развивающихся OpenSource проектов для электронной коммерции — OpenCart выпустил новую версию v1.5.0 RC1 для финального тестирования. Я беглым взглядом пробежался по меню настройки и выделил изменения по сравнению с версией 1.4.x.
Читать дальше →
Total votes 41: ↑35 and ↓6 +29
Comments 46

Мой опыт восстановления зрения

Reading time 9 min
Views 277K
   Этим летом я был на некоторое время предоставлен сам себе – всех своих я отправил подальше от дыма, а сам, недолго думая, решил немного подтянуть здоровье. Не просто записаться в тренажерный зал и накачать «квадратиков» для пляжа, а именно обследоваться у некоторых врачей, чтобы выработать для себя вектор дальнейших действий, дабы совсем не превратиться в «овоща».

image

   Расскажу лишь про свой опыт восстановления зрения – именно оно больше всего подвержено риску у любого «компьютерного» человека.
Читать дальше →
Total votes 494: ↑397 and ↓97 +300
Comments 208

Двадцать лет тюрьмы и миллион рублей штрафа за нелицензионный файл!…

Reading time 4 min
Views 26K
Нынешнее сообщение является естественным продолжением вчерашнего, так что сперва напомню известные со вчерашнего дня факты.

Вчера Novikov в своём блоге подметил, что Московская городская дума готова была предложить (26 августа, устами своего депутата Милявского) попрать все идеалы внутренней свободы, а вместо того поклониться одновременно демону тоталитаризма и золотому тельцу правоторговли, то есть составить чёрный список сайтов, предлагающих нелицензионные файлы, и за любое посещение такого сайта штрафовать каждого гражданина на сумму от 2000 до 5000 рублей.

Это прискорбно.
В частности, Новиков тотчас постиг и сокрушался о том, какие небывалые и коррупционные бездны произвола правоохранительных структур откроются во всяком таком случае, когда какой-нибудь сетевой червь понаоткрывает запретные сайты без ведома пользователей, или если другой сайт поставит невидимый <iframe> или прозрачный пиксел запретного сайта. Опять же и для цензуры возможности какие богатейшие.
Там же в комментариях MSVGePard без малейшего промедления открыл, что упомянутый Милявский имеет еврейское расовое происхождение и даже гражданство Государства Израиль ([1], [2]), и притом далеко не совершенно чужд и сам нелицензионщине: в прессе не раз упоминалося, что Милявский миллионы нажил, создав свой рынок «Горбушкин двор». Ум останавливается перед потугою истолковать эту деталь биографии: не то Милявский зачищает интернетовских конкурентов своего оффлайнового бизнеса, не то обратился к чрезмерному и небывалому ещё покаянию? Да не в том ли всё и дело, что «Горбушкин двор» недавно намерены были остановить?
Подробнее эту тему раскрыл в LiveJournal блоггер martellus. В комментариях он упоминает также, что Указом Президента В. В. Путина в 2003 году Александр Милявский был награждён медалью ордена «За заслуги перед Отечеством» II степени. Видим, стало быть, что заслуженный единоросс этот и впрямь может выступить с некоторой законодательной инициативою и быть услышанным с нею в самых верхах и недрах «Единой России» преблагосклоннейше.
Увы, личный блог Новикова не транслируется на заглавную страницу Хабахабра — и оттого не все заметили эту новость, несмотря на двузначный рейтинг его блогозаписи.

А между тем вышеупомянутые события не остановилися 26 августа, а развивались и далее: сообщение Новикова можно дополнить известием о том, что на нынешней неделе (в понедельник 30 августа) в «Ведомостях» вышла статья «Штраф за пиратство». К сожалению, сама по себе эта статья не очень полезна нам, будучи не более чем собранием разноречивых мнений, более или менее экспертных и (или) официальных. Зато к ней прилагаются для скачивания собственно документы законопроекта Милявского. Их два: проект Федерального закона «Об охране авторских и смежных прав в сети Интернет и о внесении изменений в отдельные законодательные акты Российской Федерации», а с ним сборник поправок, предлагаемых ко внесению в Уголовный кодекс и в Кодекс об административных правонарушениях.

Эти поправки сегодня утром подверг сравнительному анализу LJ-блоггер i_contester и открыл такие подробности, от которых волосы должны буквально становиться дыбом на голове. Вы уж лучше присядьте, прежде чем читать о них:

Читать дальше →
Total votes 347: ↑293 and ↓54 +239
Comments 317

Инвентаризация в компании: Установка GLPI

Reading time 5 min
Views 17K
image



Пришло время и в нашей компании провести учет компьютерной техники. Компания растет, расширяется, и памяти IT отдела плюс нескольких XLS-файлов уже не хватает для быстрого и достоверного ответа что у нас и где находится.

Читать дальше →
Total votes 17: ↑14 and ↓3 +11
Comments 10

Изображаем память с помощью тетрадки в клеточку

Reading time 5 min
Views 4.4K
Где-то в архивах этого блога можно найти статью про тетрадь в клеточку и ее душевные переживания. Содержание у этой статьи скорее философское, чем прикладное. Но вот сама идея изобразить работу мозга с помощью карандаша и тетради в клеточку показалась мне довольно интересной. Как заметил автор той статьи, работу любой программы можно изобразить на бумаге. Будь то стек вызовов или регистры процессора – их легко можно изобразить с помощью клеточек.

Но это все низкоуровневые процессы. Возможность изобразить их на бумаге скорее теоретическая. На практике от нее мало пользы. Вот если бы можно было с такой же легкостью описывать более высокоуровневые процессы…
Читать дальше →
Total votes 67: ↑55 and ↓12 +43
Comments 29

Information

Rating
Does not participate
Location
Россия
Registered
Activity