Pull to refresh
28
0
Send message

О линейной регрессии: байесовский подход к курсу рубля

Reading time9 min
Views24K


Не секрет, что курс рубля напрямую зависит от стоимости нефти (и от кое-чего еще). Этот факт позволяет строить довольно интересные модели. В своей статье о линейной регрессии я коснулся некоторых вопросов, посвященных диагностике модели, а за кадром остался такой вопрос: есть ли более эффективная, но не слишком сложная альтернатива линейной регрессии? Традиционно используемый метод наименьших квадратов прост и понятен, но есть и другие подходы (не такие понятные).

Читать дальше →
Total votes 34: ↑33 and ↓1+32
Comments24

Word2Vec: классификация текстовых документов

Reading time5 min
Views28K
Известная утилита дистрибутивной семантики Word2Vec демонстрирует удивительные результаты и стабильно обеспечивает использующих её специалистов призовыми местами на конкурсах машинной лингвистики. Преимущество утилиты, как впрочем, и её аналогов – Glove и AdaGram, состоит в дешевизне процесса обучения и подготовки обучающих текстов. Но есть и недостатки – представление слов в виде векторов хорошо работает на словах, удовлетворительно на словосочетаниях, так-себе на фразах и вообще никак – на длинных текстах.

В данной статье предлагается к обсуждению подход, позволяющий представить текст любой длины в виде вектора, позволяющий проводить с текстами операции сравнения (вычисления дистанции), сложения и вычитания.
Читать дальше →
Total votes 8: ↑5 and ↓3+2
Comments4

Автоматизация развертывания Docker-контейнеров на произвольной инфраструктуре

Reading time6 min
Views25K


Контейнеризация приложений сегодня является не просто модным трендом. Объективно такой подход позволяет во многом оптимизировать процесс серверной разработки путем унификации поддерживаемых инфраструктур (dev, test, staging, production). Что в итоге приводит к значительному сокращению издержек на протяжении всего цикла жизни серверного приложения.

Хотя большая часть из перечисляемых достоинств Docker является правдой, тех, кто на практике столкнется с контейнерами, может постигнуть легкое разочарование. И так как Docker не является панацеей, а всего лишь входит в список из «лекарственных средств» от рецепта автоматического деплоя, разработчикам приходится осваивать дополнительные технологии, писать дополнительный код и т.д.
Читать дальше →
Total votes 21: ↑21 and ↓0+21
Comments28

Лучшие практики Go, шесть лет в деле

Reading time18 min
Views59K
В 2014 году я выступил на открытии конференции GopherCon с докладом под названием «Go: Best Practices for Production Environments». В SoundCloud мы были одними из первых пользователей Go и к тому времени уже два года писали на нём и поддерживали Go в бою в той или иной форме. За это время мы кое-чему научились, и я попытался поделиться частью этого опыта.

С тех пор я продолжал программировать на Go в течение всего рабочего дня, сначала в командах SoundCloud, отвечающих за операционную деятельность и инфраструктуру, а теперь работаю в компании Weaveworks над Weave Scope и Weave Mesh. Также я усердно трудился над Go kit, набором инструментов для микросервисов с открытым исходным кодом. И всё это время я принимал активное участие в развитии сообщества Go-программистов, встречался со многими разработчиками на митапах и конференциях по всей Европе и в США, коллекционируя их истории успехов и провалов.

В ноябре 2015-го, на шестую годовщину релиза Go, я вспоминал то своё первое выступление. Какие из лучших практик прошли проверку временем? Какие из них устарели или стали неэффективными? Появились ли какие-то новые методики? В марте мне представилась возможность выступить на конференции QCon London, где я рассказал о лучших практиках 2014 года и дальнейшем развитии Go до 2016 года. В этом посте представлена выжимка из моего выступления.

Ключевые положения я выделил в тексте в виде Top Tips — лучших советов.

А вот и cодержание:

  1. Среда разработки
  2. Структура репозитория
  3. Форматирование и стиль
  4. Конфигурация
  5. Разработка программы
  6. Логирование и метрики
  7. Тестирование
  8. Управление зависимостями
  9. Сборка и развёртывание
  10. Заключение
Читать дальше →
Total votes 68: ↑63 and ↓5+58
Comments19

BOOTSTRA.386: тема для Bootstrap в духе 1980-х

Reading time1 min
Views109K
Оказывается, некоторые темы для Bootstrap — это маленькие произведения искусства. В рамках надвигающейся пятницы хотелось бы рассказать об одной из таких тем.

Крис МакКензи — явно один из тех, кто скучает по старым добрым временам DOS, EGA/VGA и Turbo Vision, иначе он вряд ли бы решился сделать что-то подобное. Так что если вы успели устать от засилья плоского дизайна, то добро пожаловать в мир BOOTSTRA.386!

Осторожно: будьте готовы к острому приступу ностальгии. Единственное, чего не хватает для полного погружения — так это навигации с клавиатуры, ну и курсора в виде прямоугольного блока.

image

Читать дальше →
Total votes 201: ↑192 and ↓9+183
Comments45

Инициатива против снижения лимита покупок за рубежом с 1000 до 150 евро в месяц

Reading time1 min
Views174K


С Новым Годом друзья! К сожалению в этом году лимит беспошлинного ввоза интернет-покупок из-за рубежа в России может быть снижен с 1000 евро в месяц до 150 евро. У нас есть шанс повлиять на это.
Читать дальше →
Total votes 140: ↑122 and ↓18+104
Comments510

Сохранить и преумножить деньги в Интернете – где и как?

Reading time6 min
Views2.9K
Инфляция неумолима, она пожирает деньги. А так хочется не только сохранить, но и приумножить. И еще раз преумножить и еще раз.
Вот уже несколько месяцев присматриваюсь, куда вложить деньги, но то вкладывать особо нечего, то доходность не устраивает, то инструментарий дает сбои. Я искал вариант вложить деньги на срок 6-9 месяцев с максимальной выгодой. Поскольку часть моего заработка в электронных деньгах, то искал я возможность вложить именно их, не вставая со стула.
Заработать в Интернете способов сотни, но это работа. А какие возможности вложить деньги? Вариантов, на самом деле не так уж и много.

ПИФы
Весной – в начале лета я планировал вкладывать именно ПИФы, но в тот момент денег не было. Посмотрев статистику за предыдущие 2-3 года, я пришел к выводу, что именно этот финансовый инструмент может принести наибольшую доходность. Самые успешные показывали до 60-80% годовых! В общей массе ПИФы давали не менее 20-40% годовых. Были конечно и исключения, которые уходили в минус, но таких меньшинство.
За покупку и продажу пая берут обычно около 1,5%, в зависимости еще от того, как долго будет ваш пай на руках. Чем дольше – тем меньше процент при продаже. Около 3% за обслуживания пая. Сразу вычтут 13% налога с дохода (Но это, конечно, если ПИФ принесет доход).

Читать дальше →
Total votes 46: ↑38 and ↓8+30
Comments75

Создание своего банка, или Как обеспечить себе безбедную старость

Reading time15 min
Views354K
Наблюдая за своими родителями-пенсионерами, а точнее за размерами их пенсий, я крепко задумываюсь о том, как обеспечить себе нечто оное в достойном меня размере. На государство в составе СНГ рассчитывать, похоже, не приходится. Значит, надо что-то делать самому! И начинать надо сейчас, пока мне 32 года, есть какой-никакой заработок и силы крутиться. Раньше были мысли, что я буду вечно молодым, вечно здоровым и все время что-то делать. Постепенно начинаю осознавать, что лет 20… 30 — и силы будут таять (или распыляться). Поэтому пару лет назад я начал понемногу что-то делать в этом направлении. Получил некоторый опыт, который может быть интересен уважаемому сообществу. Даже если для читателя вопрос пенсии сейчас звучит безумно абстрактно, то все равно рекомендую хотя бы пробежаться. Если бы я 5 лет назад почитал такой материал — я был бы уже существенно богаче!..
UPD: в статье добавил про смысл диверсификации, а то в комментариях много вопросов было…
В общем, рекомендую!
Total votes 222: ↑155 and ↓67+88
Comments345

Инвестирование для чайников

Reading time12 min
Views377K
Финансы для чайниковМногие из читателей хабра неплохо зарабатывают (я надеюсь) и имеют возможность покрывать не только текущие расходы, но и тратить деньги на что-то перспективное. Опять же, многие из нас задумываются — как отложить деньги на будущее, дабы они не «сгорели» со временем (задача минимум) и как заставить деньги делать деньги (задача среднемум средняя). И, снова, многие из нас мечтают, чтобы сбережения росли достаточно быстро, чтобы устроить себе пенсию не в 65 лет, а пораньше. Причем в идеале так, чтобы не надо было тратить все свое время на это, а заниматься любимым делом.

Этим вопросами я заинтересовался года два назад. Как оказалось, задача максимум решаема, а мечта о свободном времяпрепровождении до 60 лет вполне реальна. Более того, на Западе популярен подход «asset allocation», который позволяет тратить на вопрос инвестирования до часа в год и иметь на выходе результаты, сравнимые с профессиональными инвесторами. Причем необходимо всего лишь крепко разобраться в базовой информации и не погружаться в пучины технического и фундаментального анализа.

Как оказалось, этот подход доступен и в нашей стране, в нашей действительности. Результатами исследования я хочу поделиться с вами. Да, пока только исследования… Через 30 лет расскажу о результатах практики.

Сейчас я вижу, что, если бы я об этом задумался десять лет назад, я был бы уже на полпути к своей мечте! Как жаль, что я тогда думал только о компьютерах (ну… не только о них, но о финансах уж точно не думал!)… Впрочем, лучше позже, чем совсем-совсем позже.

P. S. Почему «Сделай сам»? Потому что вы сами можете накопить себе неплохие деньги — вы, а не банки, пенсионный фонд или финансовые компании!
UPD. P. P. S. Мои размышления базируются на статье Сергея Спирина «Портфель лежебоки, или как за 12 лет увеличить капитал в 118 раз». Собственно, от него я и узнал про эту инвестиционную стратегию. Я — IT-шник, а не финансист. Посему за подробностями от эксперта — к нему!
Детали, как водится, под катом!
Total votes 118: ↑105 and ↓13+92
Comments184

Обработка сложных событий с помощью цепочек

Reading time10 min
Views6.3K
В статье описывается метод обработки сложных событий с помощью цепочек. В качестве практического приложения была выбрана относительно простая задача — прогнозирование движения валютного курса.

При построении цепочек использовалась методология, описанная в статье “Автоматический анализ текстов без модераторов” и в комментариях к ней. После описания алгоритма будут предложена стратегия с положительным математическим ожиданием прибыли.
Читать дальше →
Total votes 19: ↑17 and ↓2+15
Comments18

Canary: умная система безопасности для дома

Reading time3 min
Views25K


Систем безопасности для дома существует огромное количество, есть продвинутые системы, есть очень продвинутые, а есть — простые и очень простые.

Система Canary выделяется из ряда себе подобных, в первую очередь тем, что ее действительно можно назвать «умной» — реагирует она не только на разного рода события, типа открытие/закрытие дверей, но и на необычные сигналы, например, необычное время открытия двери в квартиру.

Читать дальше →
Total votes 37: ↑30 and ↓7+23
Comments32

Интернет может рухнуть. Нам нужен «План Б»

Reading time1 min
Views42K
Ролик с TED 2013 (более 1 000 000 просмотров)
Дэнни Хилс (Danny Hillis, создатель Connection Machine, сооснователь Long Now Foundation) попытается донести до умов, свои идеи, достойные распространения.


В этом видео:
— Справочник е-мэйлов 1982 года
— Как Дэнни регистрировал третье в мире доменное имя (кстати, какие были первые два?)
— «От каждого по способности, каждому по потребности» — коммунистические принципы на службе мин. обороны США
— Почему интернет хрупок и уязвим и что такое «отрицательное время»

«Почему-то мы сосредоточены на защите компьютеров в Интернете, а не на защите самого Интернета.
Интернет довольно хрупкая система»

«Сейчас Интернет используется не так и не для того, для чего он задумывался изначально»

«Интернет меняется настолько быстро, что даже эксперты не обладают полной картиной происходящего»

«На протяжении долгих лет множество моих единомышленников терпеливо пытаются донести до умов, что нам нужна независимая резервная система»

Под катом тройка первых коммерческих доменных имен и еще несколько выступлений Дэнни Хилса
Читать дальше →
Total votes 55: ↑47 and ↓8+39
Comments51

Физический дизайн структур хранения в СУБД Teradata

Reading time12 min
Views21K

Что такое физический дизайн структур хранения


Основная цель, преследуемая в ходе разработки физической модели данных, — создание таких объектов для конкретной платформы/СУБД, которые позволят достигнуть максимальной производительности запросов/приложений, создающих основную нагрузку, сведя при этом дополнительные затраты, такие как необходимость поддерживать дополнительные индексы, выполнять материализацию производных данных и т. п., к минимуму.
Все реляционные СУБД построены на одних принципах, но каждой платформе присущи уникальные черты в виде наличия различных типов объектов и особенностей их реализации. По этой причине процесс физического моделирования является платформенно-зависимым, в отличие от логического моделирования, основная цель которого — достоверно описать данные и бизнес-процессы.
Читать дальше →
Total votes 18: ↑16 and ↓2+14
Comments7

Устройство минималистичных посадочных страниц

Reading time7 min
Views45K


Предыдущий перевод (Landing page, которая работает), посвященный дизайну качественных посадочных страниц набрал больше 150 000 просмотров. С тех пор прошло уже много времени и подход к дизайну изменился – все больше становится минималистичных страниц, о которых и пойдет речь в статье.
Читать дальше →
Total votes 48: ↑41 and ↓7+34
Comments23

Dive into Litecoin, или как начать майнить scrypt валюту

Reading time7 min
Views137K
image

Предисловие

Ни для кого уже не секрет, что криптовалюта набирает силу, становясь все ближе к мировому признанию. В свое время я занимался майнингом Bitcoin на видеокартах, но вот уже больше года как я остался «не при делах» с появлением ASIC майнеров. Я всегда был против ASIC — ферм, а потому решил для себя не присоединятся к их владельцам. Пару слов о причинах — ASIC фермы дорого стоят, мало распространены и весьма специфичны, это очень сильно увеличивает порог вхождения в майнинг и в криптовалюту как таковую, а выборочное распределение этих устройств способствует падению энтропии. Кому-то эти причины могут показаться недостаточно весомыми, но для меня они стали решающими. Не так давно я понял, что один из форков Bitcoin начинает набирать силу, и он защищен от ASIC-ферм, что вызвало мой серьезный интерес. Тем не менее большинство информации в интернете устарело, и мне пришлось пройти тернистым путем чтобы заставить свою первую ферму работать, потому я решил поделится с вами опытом.
Читать дальше →
Total votes 100: ↑66 and ↓34+32
Comments144

Маленькая хитрость — большие возможности. Оптимизация ключевых слов

Reading time3 min
Views12K
Предыстория. Вчера Apple прислал мне письмо счастья о том, что моя программа нарушает авторские права одной компании. Конекретно — я использую их торговую марку. Само собой я тут же начал разбираться что да как и обнаружил зарегистрированную торговую марку в списке моих ключевых слов для английской локализации приложения. Оказалась она там, благодаря сервису подсказки ключевых слов SensorTower. Данный ключевик был мне горячо рекомендован, по соотношению генерируемый трафик / легкость попадания в топ. В топ то я попал, но вон оно как все обернулось. А дальнейшее развитие событий привело меня к осознанию одной интересной особенности App Store о которой я и хочу вам рассказать.

image
Читать дальше →
Total votes 27: ↑25 and ↓2+23
Comments13

Разбираем интерфейсные детали-ошибки на примере одного банковского клиента

Reading time8 min
Views74K
Время изменилось. Теперь в одиночку можно написать приложение для миллионов человек. Не нужно думать ни о хостинге, ни о дистрибуции, ни о масштабируемости — облака сделают всё за вас.

Теперь один человек может влиять на миллионы. А значит, тем сильнее бремя ответственности за собственные действия и за выпускаемое качество. Метро в бедные послевоенные годы делалось таким помпезным и «дворцовым» не только ради хвастовства, а чтобы миллионы простых людей каждый день развивали вкус.

Стоит сейчас какому-нибудь «Энгри бёрдз» написать «2-е птицы», и все молодое поколение будет неправильно наращивать окончания у числительных (на самом деле, наращиваются только порядковые числительные: «2-й дом», «1-му победителю», но «2 птицы»).

Поэтому любой уважающий себя клиентский программист давно должен прочитать Тафти, Чихольда, Раскина и Мильчина. Даже если у вас есть дизайнер и редактор в компании. Потому что и он иногда может нести чушь (всё зависит от квалификации). Или, наоборот, чтобы правильно следовать гайдлайнам и продолжать развивать приложение в едином стиле.

Поговорим сегодня о внимании к деталям на одном практическом примере (будет много картинок).

Читать дальше →
Total votes 210: ↑157 and ↓53+104
Comments183

Как социальные сети влияют на продвижение сайта

Reading time3 min
Views43K


Современное общество уже не представляет жизни без фейсбука и твиттера. Аудитория социальных сетей в России на данный момент составляет 54,7 млн. пользователей и продолжает неуклонно расти. Но помогают ли социальные факторы в поисковом продвижении сайтов?

Twitter


Поисковые системы охотно индексируют твиты. У Яндекса даже есть отдельный поиск по твитам. Ссылки в твитах также индексируются, в том числе и непрямые (например, через сервисы goo.gl и др.). При этом твиттер индексируют быстророботы, узнать такие ссылки в выдаче можно по указанной рядом дате или времени:
Читать дальше →
Total votes 24: ↑19 and ↓5+14
Comments3

Рекомендательные системы: You can (not) advise

Reading time9 min
Views43K

Более полугода назад в поисках что посмотреть, я листал топ произведений. Это занятие повторялось уже много раз и успело надоесть — постоянно приходилось пропускать то, что я смотреть не хочу. Имхонетами раньше не пользовался, да и не доверял им из-за специфики искомых произведений. На сайте, где я производил поиски, была возможность создать свой список просмотренных произведений и выставить оценку, также были доступны оценки других пользователей. Тут мне в голову пришла гениальная идея, как оказалось позднее банальная, — используя оценки других пользователей делать рекомендации. Данная деятельность называется коллаборативной фильтрацией, а программа её реализующая — Рекомендательной системой(РС). Оглядываясь назад я понимаю, что совершил множество ошибок из-за недостатка информации и её труднодоступности в данной тематике, а что самое главное — сильно переоценил РС. В данном посте я сделаю обзор основных типов и алгоритмов РС, а также постараюсь передать часть своих знаний и опыта.
Читать дальше →
Total votes 43: ↑39 and ↓4+35
Comments20

Идентифицировать человека среди 1 500 000 пользователей мобильной связи можно всего по 4 точкам во времени и пространстве

Reading time2 min
Views123K
Каждый из нас изо дня в день бывает в одних и тех же местах примерно в одно и то же время — дом, работа, спортзал, магазин, снова дом… Наш ежедневный маршрут достаточно стабилен и в то же время уникален. Совместное исследование американских и бельгийских учёных продемонстрировало, что степень его уникальности гораздо выше, чем можно предположить.

Анализ базы данных, в которой была собрана анонимизированная информация о времени и месте звонков и СМС 1 500 000 абонентов на протяжении пятнадцати месяцев показал, что для идентификации 95% людей достаточно знать всего четыре пространственно-временные точки.

Всего две точки позволяют различить индивидуальный след половины пользователей, а одиннадцати достаточно, чтобы различить все до единого следы. На иллюстрации слева приведены примеры таких индивидуальных следов. Авторы исследования сравнивают уникальность мобильного следа с отпечатками пальцев — в 1930 году французский пионер криминалистики Эдмон Локард показал, что для идентификации по отпечатку пальца достаточно двенадцати совпадений деталей рисунка.

Таким образом, получив из открытых источников (Facebook, Twitter, Foursquare, LinkedIn и т.п.) всего несколько характерных для человека пространственно-временных точек, можно деанонимизировать абонента мобильной связи среди миллионов записей, не содержащих вообще никакой персональной информации, и отследить все его перемещения.
Читать дальше →
Total votes 138: ↑131 and ↓7+124
Comments122
1

Information

Rating
Does not participate
Registered
Activity