Pull to refresh
552
47.1

Замглавреда

Send message

Метод Binoculars обещает высокую точность обнаружения текста от больших языковых моделей

Level of difficulty Easy
Reading time 10 min
Views 4.9K


ChatGPT пишет не хуже человека, но можно ли обнаружить «машинность» в тексте? Хотя некоторым компаниям было бы выгоднее представить всё так, будто результат работы языковых моделей неотличим от человеческого, исследования в этом направлении активно ведутся. Авторы научной статьи «Spotting LLMs With Binoculars: Zero-Shot Detection of Machine-Generated Text» (arXiv:2401.12070) утверждают, что их метод имеет низкий уровень ложноположительных срабатываний (0,01 %), правильно обнаруживает текст от языковых моделей в 90 % случаев и работает для нескольких семейств современных продуктов.
Читать дальше →
Total votes 22: ↑22 and ↓0 +22
Comments 15

Чего ожидать от 2024?

Level of difficulty Easy
Reading time 3 min
Views 7.8K

Wolfram Community

Через несколько часов закончится 2023 год. Уходит последняя возможность сделать то, что планировалось выполнить в этом году. Уже совсем скоро начнётся 2024 год, который будет совсем другим.

С другой стороны, новый год ничем не отличается от предыдущего. Есть ли смысл придавать дате такое значение? Многие укажут, что это лишь смена одного числа на другое.

Давайте посмотрим, чего нам стоит ожидать от 2024.
Читать дальше →
Total votes 37: ↑37 and ↓0 +37
Comments 8

Почему Илья Суцкевер не ходит на работу?

Level of difficulty Easy
Reading time 7 min
Views 35K

Слева направо: Грег Брокман и Илья Суцкевер. Фон — картины Суцкевера. @gdb

Илью Суцкевера не уволили, официально не отстранили, но на рабочем месте его не видели всю прошлую неделю. В других случаях это был бы типичный прогульщик, если бы речь шла не про главного научного сотрудника OpenAI.

Почему Суцкевер не ходит в офис? Пока что сказать трудно. Зато сейчас легко предположить, почему уволили Сэма Альтмана. Для этого нужно размотать клубок OpenAI до самого основания компании.
Читать дальше →
Total votes 44: ↑42 and ↓2 +40
Comments 57

Исследователи заставили ChatGPT процитировать данные, на которых он учился

Level of difficulty Easy
Reading time 8 min
Views 32K

Несколько похожая, но иная атака от @andrewmccalip

Научная работа «Scalable Extraction of Training Data from (Production) Language Models» (arXiv:2311.17035) анализирует извлечение данных датасетов обучения из различных языковых моделей. Исследователи проверили как локальные модели, так и коммерческое решение от OpenAI. С помощью атаки на выравнивание удалось заставить ChatGPT процитировать данные, на которых обучали GPT-3.5.
Читать дальше →
Total votes 39: ↑38 and ↓1 +37
Comments 25

Гауссов сплэтинг: как это выглядит

Level of difficulty Easy
Reading time 11 min
Views 12K
Пример работы гауссова сплэтинга. Этот ролик — не видеосъёмка реального мира, а рендер в реальном времени на настольном компьютере

Всплеск внимания к технике сплэтинга связан с представленной в августе этого года статьей 3D Gaussian Splatting for Real-Time Radiance Field Rendering [Трёхмерный гауссов сплэтинг для рендера radiance field в реальном времени]. До этого, в июле, эта научная работа исследователей Университета Лазурного берега, Института информатики Общества Макса Планка и французского Национального института исследований в информатике и автоматике вошла в пятёрку лучших работ SIGGRAPH 2023.

В следующие два месяца новостные сайты, блоги и тематические форумы начали рекомендовать гауссов сплэтинг как будущее компьютерной графики. Новая техника позволит быстро отсканировать существующую сцену и после короткого обучения отрендерить её с высокой точностью, обещают восторженные голоса.

Сейчас исследователи бьются над поиском практического применения технологии и сканированием движения. В оригинальной работе речь идёт о воссоздании в первую очередь статичных сцен.
Читать дальше →
Total votes 65: ↑65 and ↓0 +65
Comments 13

Disney уволила сотрудницу, спасшую «Историю игрушек»? Не совсем

Level of difficulty Easy
Reading time 9 min
Views 23K

Кадр из «Истории игрушек 4»

В конце мая студия Pixar впервые за десятилетие сократила штат. После неудач в прокате «Базза Лайтера» компания уволила 75 сотрудников, включая двух старших менеджеров. В ленты новостных агентств новость просочилась только в начале июня, но чуткий глаз тематических СМИ выцепил среди уволенных одну наиболее интересную персоналию. В числе прочих расстались с сотрудницей, которая когда-то спасла случайно удалённую «Историю игрушек 2».

Двадцать пять лет назад, когда Pixar готовила к выходу очередной полнометражный фильм, технический директор Гэлин Сасмен выполняла свои обязанности из дома. Когда в офисе случайно удалили всю работу над «Историей игрушек 2», на компьютере Сасмен нашлась резервная копия. Такой сюжет попытались рассказать некоторые тематические сайты (1, 2, 3, 4, 5). Другие не стесняясь заявили (1, 2), что Сасмен спасла всю $3,2-миллиардную франшизу.

Случившееся в реальности сложнее и интереснее, чем простая история о несправедливости.
Читать дальше →
Total votes 89: ↑84 and ↓5 +79
Comments 71

«Роман»: что будет после «Джеймса Уэбба»?

Level of difficulty Easy
Reading time 21 min
Views 12K


На орбите Земли продолжает работать космический телескоп «Хаббл». Запустили аппарат в 1990 году, а чтобы это случилось, с 1970-х отбирали предложения, пытались выбить финансирование, проектировали, строили и готовили программу исследований. Аналогичным образом о телескопе «Джеймс Уэбб» начали всерьёз задумываться в конце восьмидесятых, его разработка шла десятилетия, увенчавшись запуском лишь в 2021 году.

Замена «Уэббу» готовится прямо сейчас. Возможно понять, какой будет следующая космическая обсерватория такого размаха. Железобетонно зафиксированы требования к проекту, выданы контракты на разработку инструментов, ещё на начальных этапах планирования показали симуляцию снимков с телескопа. Есть даже обещанные сроки запуска. Кажется, что мы можем заглянуть в будущее.
Читать дальше →
Total votes 93: ↑92 and ↓1 +91
Comments 14

TVGuardian. Задача: заменить ругательства в реальном времени

Reading time 12 min
Views 7.4K

«Он похож на зануду?» Реплика также может быть оценена, будто Уоллеса сравнивают с клячей, старой лошадью. Видеоролик Джерри Ноулза

Телеприставка подключается к аналоговому телевизору. Из-за простого корпуса из шероховатого чёрного пластика она выглядит словно пришелец из восьмидесятых. Действительно, устройство построено на технологиях конца прошлого века.

Затем из телесигнала пропадает любая обсценная лексика (или часть — уровень фильтрации настраивается). Когда на экране звучит ругательство, аудиодорожка затихает. Чтобы не терять смысл реплики, на экране появляются субтитры с заменой цензурируемого слова или выражения. После окончания нехорошей реплики звук немедленно включается снова.

Даже сегодня умные колонки не транскрибируют речь пользователя, а отсылают её в облако. Очевидно, что четверь века назад точное машинное распознавание речи было в лучшем случае мечтой. Принцип работы приставки куда проще, но также он поражает остроумием и скромностью задействованных ресурсов: вся логика занимает меньше 4 КиБ.
Читать дальше →
Total votes 49: ↑48 and ↓1 +47
Comments 26

Заблуждения программистов о тексте

Reading time 11 min
Views 19K


Возжелавший прильнуть к жанру вестернов обратится либо к десятой строчке топ-250 лучших фильмов по версии IMDb, либо уже будет обладать знанием, что начинать нужно с «Хороший, плохой, злой». Там он увидит жадных потных мужчин, которые заканчивают фильм напряжённым мексиканским противостоянием. Жалкая охота за золотом конфедератов разворачивается на фоне кровавых битв Гражданской войны между «Севером» и «Югом». Таким зритель запомнит вестерны как жанр.

В реальности «Хороший» — это не классика, а яркий представитель поджанра ревизионистских вестернов, снят в Европе и наоборот, критикует американскую идеологию направления. В нём нет ничего общего с картинами, где герой встаёт на защиту правильного и справедливого общества от злодеев или кровожадных индейцев. В пятидесятых и шестидесятых классический вестерн сошёл на нет, но в коллективном сознании критика быстро заместила критикуемый объект. Когда Марти Макфлай жалуется на анахронизм наряда, он сравнивает себя с антигероями Клинта Иствуда, а не бравыми ковбоями в исполнении Джона Уэйна.

Иногда нашему восприятию требуются корректировки. Собственные заблуждения необходимо не забыть при проектировании информационных систем. Помнить нужно о многом: для времени, карт и почтовых адресов получаются длинные списки. Для текста неожиданностей мало.

Заблуждение 1. Любые символы, кроме управляющих, имеют предсказуемую ширину


В реальности ширина символов может отличаться даже в моноширных шрифтах.
Читать дальше →
Total votes 96: ↑96 and ↓0 +96
Comments 51

Заблуждения программистов о времени

Reading time 12 min
Views 72K

Музей-скансен эпохи Средневековья в Дании в режиме обычной работы (слева) ставит целью воссоздать повседневную жизнь города на стыке XIV и XV веков. Для съёмок фильма (справа) он «погрязнел»

Для киносъёмок в музей под открытым небом Middelaldercentret внесли несколько изменений. Вместо аккуратной каменной улицы развели неприятную кашицу из грязи, не самые роскошные стеклянные окна прикрыли досками и развесили везде выцветшее тряпьё. Здания как следует измазали чем-то коричневым, кое-где зачем-то перемешав субстанцию с соломой. В случайное здание воткнули факел, а не попытались изобразить лучину или фонарь.

Причина проста: кинозритель должен узнать на экране эпоху. Приходится снабжать снимаемое полным набором заблуждений про грязных неграмотных горожан, непрекращающиеся войны и еду без специй.

При проектировании информационных систем задача стоит ровно обратная: необходимо отразить реальность и не допустить в код собственные заблуждения. Ошибок восприятия много. По крайней мере, про карты и почтовые адреса получаются длинные списки.

Попытки собрать заблуждения про время и часовые пояса на Хабре уже были шесть и десять лет назад. Но без контрпримеров не так интересно.

Заблуждение 1. В сутках 24 часа или 86 400 секунд


Иногда и кое-где стрелки часов переводят, создавая сутки длиной в 23 и 25 часов — всё очевидно. Будет неплохо углубиться в случаи поэкзотичней.
Читать дальше →
Total votes 191: ↑184 and ↓7 +177
Comments 313

Почему массивы начинаются с нуля

Reading time 7 min
Views 56K
Самое очевидное объяснение: индекс — это смещение относительно начала массива. Так элементы массива легче адресовать в памяти.

Проверим это на C.

#include <stdio.h>
int main()
{
    int data[3] = {1, 2, 3};
    int i = 0;
    printf("Array address: %p\n", data);
    do {
        printf("Array[%u] = %p\n", i, (void *)(&data[i]));
        i++;
    } while(i < 3);
}

Получим результат:

Array address: 0x7ffd7c514a6c
Array[0] = 0x7ffd7c514a6c
Array[1] = 0x7ffd7c514a70
Array[2] = 0x7ffd7c514a74


Как первый (нулевой) элемент, так и сам массив находятся по одному и тому же адресу, поскольку 0-й элемент удалён на 0 элементов от начала. Эта связь между указателями и массивами в C настолько тесная, что их даже можно рассматривать вместе.

Однако это ответ на вопрос «зачем», а не «почему». Нумеровать массивы с нуля стали не сразу. Удивительно, но развитие такого простого вопроса не умещается в предложении или абзаце.
Читать дальше →
Total votes 122: ↑121 and ↓1 +120
Comments 204

Заблуждения программистов о почтовых адресах

Reading time 15 min
Views 45K
У всех легковых автомобилей четыре колеса. Исключение из этого правила — Reliant Robin.

Если у автомобиля больше четырёх колёс, то это грузовик, автобус или вообще автопоезд. Исключение найдётся и здесь: Mercedes-AMG G 63 6x6.

Попытка описать окружающий мир легко обнаруживает ошибки восприятия, скрытые, словно слепое пятно на сетчатке глаза. Заблуждений много. По крайней мере, на списки про имена, телефонные номера или карты хватило. Настало время адресов и почтовых систем.

Заблуждение 0. Для доставки нужны адрес и имя


В мае 2016 года издание Skessuhorn рассказало трогательную историю: семья фермеров в Хоуларе на северо-западе Исландии получила письмо, на котором не были указаны ни имена получателей, ни адрес, по которому его нужно было доставить. Письмо отправил зарубежный турист, который гостил в посёлке Хоулар и точного адреса не знал. Вместо этого на конверте было изображено местоположение получателя с кратким описанием места, вместо имени — «датчанка, которая работает в супермаркете в Будардалюре».

Адрес называл точно только страну (Исландия) и посёлок (Будардалюр). Дальше шло текстовое описание: лошадиная ферма, где живёт исландская/датская семья с тремя детьми и большим количеством овец. Письмо турист отправил из столицы Исландии, Рейкьявика.


Skessuhornið
Читать дальше →
Total votes 173: ↑170 and ↓3 +167
Comments 257

Заблуждения программистов о картах

Reading time 12 min
Views 53K


Дизайн систем быстро выявляет ошибки в восприятии закономерностей функционирования мира. Те правила, которые кажутся непреложными истинами, могут ими не оказаться.

Списки подобных заблуждений составлялись про имена или телефонные номера. Настало время карт и систем навигации.

Заблуждение 1. Форма Земли — это просто


Шар — множество точек в пространстве, удалённых от центра на расстояние не выше радиуса. Однако хотя бы из-за суточного вращения форма нашей планеты отличается от идеального шара. Планета сплюснута у полюсов и утолщена на экваторе, а также обладает рельефом и испытывает циклы приливов и отливов.
Читать дальше →
Total votes 314: ↑310 and ↓4 +306
Comments 114

«Джеймс Уэбб»: 35 лет от задумки до первого снимка

Reading time 42 min
Views 27K
25 декабря 2021 года ракета «Ариан-5» взмыла со стартовой площадки ELA-3 космодрома Куру в Гвианском космическом центре. Через 25 минут двухступенчатая ракета отправила полезную нагрузку по заданной траектории в глубокий космос. Через несколько минут от второй ступени ракеты отделился и начал самостоятельный полёт космический телескоп «Джеймс Уэбб». Всего через полчаса после того, как обсерватория покинула Землю, она развернула солнечные панели.

За следующие полгода телескоп прибыл в точку Лагранжа L2, охладил свои системы и прошёл долгий процесс калибровки. 12 июля 2022 года НАСА показало первые снимки и опубликовало научные данные обсерватории.

Этому событию предшествовали долгие этапы планирования, разработки и реализации, многочисленные сдвиги сроков запуска и серьёзные намерения отменить проект полностью. О самой идее подобного телескопа задумались ещё в конце восьмидесятых, но реальностью она стала лишь 35 лет спустя.


Полномасштабная модель телескопа, которую Northrop Grumman построила в 2005 году и демонстрировала в различных городах США
Читать дальше →
Total votes 141: ↑141 and ↓0 +141
Comments 11

Трискета: носитель, который мы ещё помним

Reading time 3 min
Views 42K
Современный обыватель может легко обойтись без внешних накопителей данных. Ноутбуки и даже настольные компьютеры в наши дни редко комплектуются дисководами, а производители смартфонов всерьёз экспериментируют с моделями без портов обмена информацией вообще — заряжать такие «кирпичики» предлагают только беспроводным путём.



Подобная эпоха облачных хранилищ и обмена файлами в онлайн-мессенджерах наступила всего с десяток лет назад. До этого мы с удовольствием «нарезали» файлы на «болванки» компакт-дисков или записывали информацию на магнитные носители. Конечно, если вы начали знакомиться с вычислительной техникой после 2000 года, то некоторые из них вы могли не застать.

Единого всенародного любимца не существовало. Каждый стандарт обладал своими особенностями и всегда заметно отличался стоимостью. Это уже лишь позднее пришли USB-флэшки, которые удовлетворили всех и объёмом, и ценой.

Ренессанс винила — это лишнее подтверждение тому, как многочисленные недостатки и огрехи качества звука затмеваются выразительностью образа носителя. Что-то подобное случилось и с троппи-диском, который удивительным образом по сей день живёт в некоторых образах иконок.
Читать дальше →
Total votes 228: ↑218 and ↓10 +208
Comments 134

Переиздание трилогии GTA: кто виноват, что оно выглядит так паршиво

Reading time 10 min
Views 37K


11 ноября после двух лет разработки вышел ремастер GTA: The Trilogy — Definitive Edition. Знакомый каждому ребёнку нулевых мир убийства, проституции и наркоторговли GTA III, Vice City и San Andreas выпустили в переделанном виде, его визуально обновили и воссоздали с нуля на новом движке. В игры также добавили геймплейных новинок, например, систему чекпойнтов и колесо выбора оружия.

Мнения рецензентов игровых СМИ были в лучшем случае сдержанными. Пользователи же не скупились на негатив, и оценки ремастера немедленно отправили его на вершину антирейтингов самых плохих игр. Часть отзывов упоминает баги, слабую производительность или иные поправимые проблемы. Другие ругают стиль смартфонной игры, и это уже серьёзней: вряд ли из-за жалоб всё перерисуют с нуля.

Наименее интересно собирать коллекцию багов. Этим занимаются сотрудники компании-разработчика и любящие внимание ютуберы. Вероятно, что б́ольшую часть ошибок рано или поздно исправят, что сведёт на нет актуальность подобного списка. Куда более любопытно посмотреть на изменения стиля и найти виноватых.

Подозреваемых всего пять. Происходящее за кулисами ещё долго останется загадкой, но ничто не помешает спекулировать и разводить слухи.
Читать дальше →
Total votes 51: ↑49 and ↓2 +47
Comments 31

Who controls App Store: Martians or AI? Closed session of Russia's Federation Council and Apple leaked online

Reading time 2 min
Views 3.2K


Video recording of a closed session of the upper house of Russia's parliament was leaked online by Telegram channel A000MP97. In the video, Andrei Klimov, head of the Ad Hoc Sovereignty and Preventing Interference in the Domestic Affairs Commission, demands Apple to disclose who controls the App Store: people from Mars or artificial intelligence?

On September 16th, a closed session of the Commission took place, and representatives of Apple and Google were among those who were invited. The session discussed ways to protect sovereignty of the country, in particular, the fact that the Navalny app was still available in Apple App Store and Google Play. The services were accused of being complicit with organisations deemed extremist and banned in Russia as well as interference with Russian elections.
Read more →
Total votes 17: ↑17 and ↓0 +17
Comments 0

20 лет Windows XP

Reading time 8 min
Views 25K

Пожелтевшие виноградные поля холмов «Безмятежности», фотография 26 ноября 2006 года, Голдин+Сеннеби

25 октября 2001 года на полках магазинов появились зелёные и синие коробочки с названием Windows XP. Месяцем ранее, 24 сентября, в продажу начали поступать компьютеры с новой системой. Ещё за месяц до этого, 24 августа 2001 года, ровно 20 лет назад, Windows XP «ушла на золото», то есть отправилась на фабрики тиражирования и партнёрам.

За двадцать лет своей жизни Windows XP установили на бессчётное число настольных компьютеров, ноутбуков и разнообразных единиц оборудования. Из-за своей неприхотливости вышедшая из продажи и уже не поддерживаемая система продолжает встречаться и по сей день. Её появление — это как переосмысление разработки Windows внутри Microsoft, так и основа домашнего компьютера на следующее десятилетие.
Читать дальше →
Total votes 46: ↑45 and ↓1 +44
Comments 94

Хроника противостояния Роскомнадзора и Twitter (обновлено 2021-03-21)

Reading time 5 min
Views 40K


10 марта в 10 утра по московскому времени Роскомнадзор заявил, что доступ к Twitter для пользователей из России будет замедлен. Поводом стало размещение 3168 единиц контента, «склоняющего несовершеннолетних к совершению самоубийств, содержащего детскую порнографию или информацию об использовании наркотических веществ».

Замедление — уже не первое столкновение сервиса микроблогов и российского регулятора. Ниже хронология этого и предыдущих конфликтов.
Читать дальше →
Total votes 67: ↑66 and ↓1 +65
Comments 231

[Запуск перенесён на 30 мая из-за метеоусловий] Исторический запуск Demo-2: сегодня SpaceX отправит людей на МКС

Reading time 9 min
Views 22K
В прошлую пятницу, 22 мая, ракета Falcon 9 с пилотируемым кораблём Crew Dragon прошли проверку Flight Readiness Review — стандартную операцию для пусков ещё с эпохи шаттлов. Изначально предполагалось, что FRR закончится в четверг, но анализ продлился 2 суток. Сотрудники SpaceX, НАСА и ответственные за эксплуатацию МКС оценили безопасность космического корабля и ракеты-носителя. Администратор НАСА заявил, что разрешает запуск SpaceX. В тот же день SpaceX успешно провела огневые испытания ракеты.

В выходные SpaceX провела генеральную репетицию старта. Экипаж корабля вышел на него в лётных скафандрах, персонал отработал основные процедуры — лишь ракету не заправили. В этот понедельник, 25 мая, ракета прошла процедуру Launch Readiness Review. В её ходе НАСА оценила вероятность потери экипажа в 1 из 276.

Череда строго распланированных проверок и пресс-конференций скрывает за рутиной уникальность этого запуска. Сегодня, 27 мая, в 16:33 местного времени (в 23:33 по Москве) SpaceX планирует запустить людей на орбиту. Впервые c 2011 года американский астронавт отправится на орбиту Земли с американской территории на американской ракете. Впервые в мире частная космическая компания запустит человека в космос. Впервые при запуске человека первая ступень ракеты будет сохранена для повторного использования.

Источник фотографии слева: Илон Маск
Total votes 45: ↑43 and ↓2 +41
Comments 70

Information

Rating
Does not participate
Location
Екатеринбург, Свердловская обл., Россия
Registered
Activity