Pull to refresh
548
26.5

Замглавреда

Чем меньший уровень экспертизы и специализированных знаний нужен для написания комментария, тем их больше будет. Как правило, больше всего резвятся в комментах под заминусованными статьями, офтопом или полурелевантной политикой, а вот в сложный технический текст заглянет не каждый.

Огорчаться по этому поводу смысла нет — это просто закон природы. Скорее, я тут пишу объяснение для авторов статей: если вы вложили в душу в тяжёлый технический текст, а комментов кот наплакал, не расстраивайтесь. В таких случаях комментарии появятся не сразу, а сравнивать их количество не нужно.

Единичные случаи, фотографии небольшим, а не общим планом (чтобы не было видно, кого на самом деле больше) представителей легиона «Свободная Арабия» численностью в 6,5 тыс. человек, выборочность источников (в той же картине «Триумф воли» снимали иначе) и так далее. Вы очень умный и начитанный человек, но к конкретной ситуации это неприменимо.

Вопрос ведь не в том, могло это случиться или нет. Вопрос в том, почему языковая модель оперирует делением на расы в понимании мира американских институтов общества. Обратите внимание, что в чуждых для них контекстах встречаются как негры и азиаты, так и коренные жители Северной Америки с латиноамериканцами. Последние две категории существуют в первую очередь в США. Если в Россию из США приезжает латиноамериканец, к нему будут относиться ровно так же, как к потомку ирландских беженцев XIX века.

Проблема даже не в искажении истории, а абсурдности представления мира через линзу борьбы с межэтнической напряжённостью в США. В то время как OpenAI, Anthropic и Midjourney смогли сделать продукты, более-менее подходящие для глобальной западной культуры (и не требующие уточнений «мне надо исторически достоверно»), в «Гугле» вот такая близорукость, которую с недоумением воспринимают даже на их Родине.

В США в период коронавирусной пандемии технические компании раздули штат до немыслимых размеров. После окончания пандемии произошла коррекция.

Впрочем, не до конца. Даже сейчас в «Гугле» работает в полтора раза больше людей, чем пять лет назад. При этом вряд ли компания выпускает в полтора раза больше продуктов, не так ли? Где же эта сверхпродуктивность от нейросетей?

Повод и одна из причин сокращений — возросшая ключевая ставка в США. Внезапно выяснилось, что теперь нужно не просто стоять на месте, а показывать рост в хотя бы 5 %. Вообще, экономисты в США давно развили теорию, что безработицу нужно регулировать через уровень инфляции (у них обратная зависимость). Но это отдельный разговор.

Фондовый рынок прямым образом вознаграждает за увольнения. Бонусы топ-менеджеров завязаны на цену акций. Эдакие «кровопускания» приводят именно к росту цены акции компании.

А ещё остальные компании помельче просто подражают гигантам. Это не какие-то домыслы, а хорошо задокументированное поведение.

Никакого массового увольнения из-за замены нейросетями не происходит.

Обновлено 2024-01-31 15:00 МСК: Александр в комментариях к треду в микроблоге заявил, что всё рассказал Карине. В ответ она удивилась и долго задавала вопросы. Сама девушка не пользуется X (бывший Twitter).

Про комитет — это моя ирония. Я этот орган выдумал. Никто не приходит и не диктует, как правильно писать сокращения.

Это как жанры в музыке: нет единого стандарта, как характеризовать различные композиции. Где-нибудь в недрах «Ютуба», наверное, идут баталии в комментариях под клипами Скриллекса про то, что нужно называть эти треки электрохаусом. Спорящие легко могут заявить, что в настоящем дабстепе должны присутствовать элементы даба, особого направления ямайской музыки. В любом случае подобные споры будут полностью непродуктивны, поскольку ни одна из сторон мнение не поменяет.

Эта моя ирония — про некорректность вопроса «почему не устоявшийся термин». Потому что никто не сделал этот термин «устоявшимся»: центрального регулятора нет.

***

А ведь когда-то регулятор был. Но после эпохи перестройки в русский язык иностранные термины заходят в три этапа:

  1. Написание буквами английского алфавита. (Именно английского: не ищут специальные символы, а пишут с заменами. Пример: Haagen-Dazs, а не Häagen-Dazs. Других символов на клавиатуре нет.) При этом даже в устной речи слово никак не склоняется, что режет слух.

  2. Постепенный вход в русский язык в кириллическом написании. Как правило, по правилам практической транскрипции, но иногда с нарушениями.

  3. Почти сразу же — слово начинает склоняться и участвует в словообразовании.

Например, все три этапа прошло слово «Интернет». Ещё в конце девяностых его употребляли латиницей и без склонений. Сейчас некоторые предлагают даже писать «интернет», со строчной, а ещё, к примеру, есть прилагательное «интернетный».

При этом у процесса три характеристики:

  • Неизбежность. В русском языке 33 буквы. Латиница в литературном русском языке не используется. Рано или поздно термин записывается кириллицей, когда выходит за рамки специализированного сленга.

  • Необратимость. Обратно процесс не идёт. НАСА, «Боинг», ДАРПА и любые другие крупные иностранные организации, известные русскому языку до перестройки, пишутся кириллицей. NASA, Boeing и DARPA — это недочёт.

  • Неуникальность относительно других языков. Более того, там всё похлеще. В английском языке никто даже не подумает использовать кириллицу. Пишут sputnik и Ilizarov apparatus. Криков «а давайте напишем кириллицей» там почему-то не наблюдается. Какой национализм творится во французском, я вообще молчу: замены ради замен.

Смелые нонконформисты (типа меня) сразу приближают третий этап. Это делать возможно, поскольку некоторые термины переводятся однозначным образом, а правила практической транскрипции зафиксированы в соответствующих справочниках.

Аббревиатуры могут отличаться по звучанию и даже числу букв в русском и английском языках. Это нормальное явление. Примеры: ВОЗ и WHO, ООН и UN.

Эта историческая справка — про некорректность вопроса «почему не устоявшийся термин». Потому что это не устоявшееся написание, а переходное.

Постепенно станет общепринятым написание «БЯМ», пусть «LLM» и будут помнить. Примерно так же все говорят «процессор» и «видеоускоритель», хотя помнят термины «CPU» и «GPU». Я иду в авангарде, следуйте за мной.

***

Приведением статистики, кто как пишет, вы лишь демонстрируете, что устоявшегося написания нет даже на Хабре. Есть как минимум двадцать примеров употребления «БЯМ» в публикациях. Вопрос «почему не устоявшийся термин» опять некорректен.

Нет ничего труднопереводимого и неоднозначного в трёх словах «large language model». Они переводятся, заимствовать их латиницей смысла нет. Тем не менее некоторые ленятся.

А ещё продолжать писать «LLM» безопаснее. Если так не делать, тебя заклюют в комментариях. Ваш довод про статистику даже звучит странно: нужно писать так, как мы говорим, потому что другие пишут так, потому что их мы уже так делать заставили. Круг замкнулся.

В других местах всё ещё более расплывчато. На «Википедии» пишут «БЯМ». В соответствующей статье термин «LLM» просто не упоминается.

Кстати говоря, чтобы искалось лучше, я у себя в тэгах публикаций про БЯМ ставлю как LLM, так и БЯМ. Поэтому я посчитан в поиске Хабра как сторонник написания «LLM». А ещё в некоторых статьях из поиска «LLM» употребляется где-нибудь в листинге кода или является частью названия модели.

От самого довода про число страниц в поиске вы быстро захотите отказаться. Я могу писать, не напрягаясь, по тридцать публикаций про одну и ту же тему в месяц. Через год написание кириллицей станет доминирующим. Представляете, в 2025 году я вам начну диктовать написание «БЯМ» этим же самым доводом? Вой будет стоять до небес.

Там геоблок по айпишникам, наверное. Копия есть в «Архиве Интернета».

Где устоявшийся? Покажите, пожалуйста, решение Комитета по аббревиатурам и сокращениям русского языка.

Вы вот так свои беспочвенные претензии характеризуете — «справедливая критика»? Ну-ну.

Вам что-то не понравилось — я вас услышал. Проблема в том, что я человек спокойный и знаю, что всем угодить невозможно. Я не пряник, чтоб всем нравиться.

Я посчитал нужным составить опрос с такими вариантами ответа. Когда вы спросили, почему, я вам ответил. В ответ я получил несколько комментариев на безграмотном русском языке: неправильное написание «не», ошибки в расставлении запятых, смайлики на Хабре. Мне это неприятно.

Больше объяснять и обосновывать своё решение не буду. Да и не нужно было начинать. Спорьте с кем-нибудь другим, а не тратье моё время.

Пожалуйста, не диктуйте мне, что мне делать. Особенно с такими грубыми ошибками в орфографии и пунктуации.

Пишите сами такие статьи, которые считаете нужными.

Мне все эти подразделения неинтересны. Задача опроса — выяснить, кому среди попробовавших «Копайлот» понравилось, а кому нет. Для всех остальных (кто не пишет код и/или не пробовал) предусмотрена третья опция.

Это следствие раздутого штата ковидных времён и скачка уровня инфляции в США. Инвесторы больше не готовы заливать всё деньгами, поскольку деньги подорожали (ключевая ставка выросла).

В «Гугле» всё ещё значительно больше сотрудников, чем до 2020 года. Чтобы вернуться на уровень пятилетней давности, нужно уволить ещё треть штата, 60 тыс. человек. Текущее «огромное сокращение» — это в пять раз меньше, 12 тыс. сотрудников.

Кстати, когда читаете рассказы «как попасть на работу в большую американскую компанию», поглядывайте на год найма их автора. Совет нанятых в 2021 и 2022 годах менее ценен, поскольку критерий отбора тогда был более щадящий.

А ещё снижение расходов приносит рост цены акций, по крайней мере, в краткосрочной перспективе. Если сократить штат, то фондовый рынок за это буквально вознаградит — бонусы топ-менеджеров часто завязаны на рост цены акций.

Наконец, все друг другу подражают. Все прыгнули с девятого этажа — и я прыгну:

The tech industry layoffs are basically an instance of social contagion, in which companies imitate what others are doing. If you look for reasons for why companies do layoffs, the reason is that everybody else is doing it. Layoffs are the result of imitative behavior and are not particularly evidence-based.

К появлению систем автодополнения кода это не имеет никакого отношения.

Потому что это вариант голосования для не нашедших кнопку «Воздержаться».

По ссылке открывается очень вольный перевод (если вообще перевод). Утверждения текста Кена Шерриффа переданы неаккуратно. С самого начала идёт искажение:

В 1955 году для нужд ВВС США было разработано специальное вычислительное устройство Bendix Central Air Data Computer

У Кена сказано не это, а то, что ящик напичкан по последнему писку электромеханических технологий 1955 года:

This electromechanical marvel was crammed full of 1955 technology

Текст Кена не указывает, когда компьютер был собственно разработан. Вполне вероятно, что устройство разрабатывать начали хоть сразу после Второй мировой, когда зародились реактивные самолёты, а механические компьютеры уже были отточены. Загляните, например, в выпуск журнала Aviation Week от 1953 года, где про такие устройства рассказывается с 45-й по 48-ю страницы как про состоявшийся факт. Для конкретно CADC патент по ссылке из статьи датируется 1954 годом.

Вероятно, Кен взял год из книжки 1956 года, в которой на 171-й странице рассказывается, что концепт компьютера был представлен в 1955 году, а вот в 1956 году уже было налажено производство. Ну и вообще литературкой по устройству он озаботился: в тексте указывается, что он взял руководство из библиотеки конгресса США.

Допустимо ли додумать какой-то факт, который в оригинале не указан? Для перевода, скорее всего, нет. В лучшем случае для таких манёвров предусмотрены пометки «прим. пер».

Ну и дальше в тексте по ссылке продолжаются эти искажения. В этом же первом абзаце бомбардировщик Б-58 из текста Кена стал Б-52. Ниже зачем-то даны картинки (у Кена не было) с этими самолётами, где опять приводится Б-52.

В целом текст по ссылке значительно уходит от текста Кена Шерриффа: дописаны собственные разделы, другие сокращены или убраны вовсе, структура абзацев иная. Я бы его переводом и вовсе не назвал. Это что-то оригинальное, написанное самостоятельно по нескольким источникам. Зачем автор пометил это как перевод — загадка.

Это тоже хорошо известный приём: товар редактируют на другой, обзоры остаются. Иногда (в описанном вами случае) характер товаров настолько различается, что это прямо заметно.

А где здесь опечатка? Написано же, что сумма кубов, а не куб суммы.

Исправил, спасибо.

Поправил, спасибо.

Насколько я понимаю, потому что первая компания честно продаёт устройства с закрытой экосистемой, а вторая ведёт нечестную конкуренцию и пытается выжать остальных любыми доступными способами, включая мутные схемы.

Расширил этот абзац, спасибо.

Information

Rating
Does not participate
Location
Екатеринбург, Свердловская обл., Россия
Registered
Activity