Языки России в Интернете


Я начал писать этот текст уже давно, так что он не планировался как политически актуальный. Но так вышло, что именно в эти дни у СМИ появился инфоповод, связанный с малыми (миноритарными) языками России. Возможно, что исследование, о котором я пишу ниже, что-то кому-то в этом смысле прояснит.


Сколько в России языков?


Это не так просто осознать, но в России говорят на внушительном числе языков. Более того, в России говорят на таких языках, которые больше нигде не распространены. Скажем, в России обитают миллионы украинцев и узбеков, вместе с тем существуют и суверенные государства Украина и Узбекистан, где соответствующие языки являются государственными. А вот в России говорят на башкирском, тувинском, удмуртском и многих (действительно многих) других языках, у которых своего государственного статуса больше нигде нет.


Государственный статус — это важно. В эпоху глобализации языкам, чтобы выжить, нужна поддержка, которая позитивно влияет на печать, масс-медиа, искусство, в конечном счёте — на желание и возможность людей говорить на родном языке.


А насколько эти языки адаптировались к новым цифровым реалиям? Правда ли, что на них говорят только в отдалённых горных аулах? Или всё-таки они являются полноправным способом онлайн-общения? Несколько лет назад мы с коллегами решили это выяснить.


Сначала это было исследование в рамках ныне уже не существующего Центра изучения Интернета и общества РЭШ (сейчас он благополучно преобразован в Клуб любителей Интернета и общества), затем мы организовали исследовательский проект в магистратуре Школы лингвистики НИУ ВШЭ, и, в общем, добились успеха. Все результаты представлены на специальном сайте Языки России, но о самом интересном, о том, что мы делали и как (а также о том, что получилось), я расскажу здесь.


Прежде всего, требовалось установить, сколько вообще в России языков, и что это за языки. Никакого общепринятого списка у лингвистов не оказалось: про некоторые языки неизвестно, жив ли ещё хоть один носитель, про некоторые нет согласия, действительно ли это язык, или на самом деле он диалект другого языка. Да и чётких критериев отличения одного от другого нет. Есть шуточный: «язык — это диалект с армией и флотом», но при всём остроумии этого высказывания Вайнрайха есть достаточно контрпримеров: у Бразилии есть армия и флот, но нет своего языка (бразильцы пользуются португальским, языком своей бывшей метрополии), более того, всего лишь диалектом, а никаким не собственным языком пользуются и американцы — обладатели самой мощной армии в мире. Ни армии, ни флота нет у Исландии (только корабли береговой охраны), зато на особость их языка никто не покушается (хотя никто не спорит и с тем, что он родственник современного норвежского).


Словом, задача оказалась непростой. Особенную сложность составили языки Дагестана. Языков (настоящих языков, не диалектов! их носители не понимают друг друга) там так много, что разобраться в этом можно только после консультаций со специалистами.


Ещё мы решили вывести за пределы своего списка титульные языки других государств. Действительно, если целая страна за пределами России говорит на каком-то языке, то, скорее всего, государственный ресурс используется и для поддержки языка. Считать такой язык языком России можно, но оценивать его представленность в Интернете по сравнению с другими языками, не подпитывающимися из-за границы, было бы некорректно: ингушский и казахский будут в совсем разных весовых категориях. Так, за бортом нашего исследования оказался осетинский: несмотря на то, что в России есть целый титульный регион, где говорят на осетинском, существует и признанная Россией отдельная страна, Южная Осетия, для которой этот язык государственный. Строго говоря, в Южной и Северной Осетии говорят на разных диалектах, иронском и дигорском. Но автоматически, компьютерно, различить их очень сложно. Так что лучше считать их одним языком, не принадлежащим к классу языков России.


Ещё один казус связан с идишем. В России номинально тоже есть регион, в котором должны проживать носители идиша — Еврейская автономная область. В то же время наши эксперты разъяснили нам, что в ЕАО носителей идиша почти не осталось, а все тексты в Интернете на этом языке пишутся почти исключительно в Израиле и в США. Так что анализировать представленность идиша в Интернете как языка России глупо. Это помимо того, что мы бы столкнулись с головной болью, связанной с многообразием вариантов правописания. Вот несколько релевантных ссылок про это: [1], [2], [3].
Итак, с языками мы определились. Их получилось 96.


Полный список языков

абазинский
аварский
агульский
адыгейский
алеутский
алюторский
амузги-ширинский
андийский
арчинский
ахвахский
багвалинский
башкирский
бежтинский
ботлихский
бурятский
вепсский
верхневуркунский
водский
гапшиминский
гинухский
годоберинский
горномарийский
гунзибский
ижорский
ингушский
ительменский
кабардино-черкесский
кадарский (возможно, наречие даргинского)
кайтагский
калмыцкий
каратинский
карачаево-балкарский
карельский
кетский
кольско-саамский
коми-зырянский
коми-пермяцкий
корякский
кубачи-аштинский
кумыкский
лакский
лезгинский
лесной ненецкий
лугово-восточный марийский
мансийский
мегебский
мокша-мордовский
муиринский
нанайский
нганасанский
негидальский
нивхский
ногайский
орокский
рутульский
санжи-ицаринский
северноалтайский
северноюкагирский (тундровый, вадульский)
северодаргинский (вкл. литературный даргинский)
селькупский
сойотско-цатанский
табасаранский
танты-сирхинский (возможно, один язык с верхневуркунским)
татарский
татский (под угрозой исчезновения)
тиндинский
тофаларский
тубаларский
тувинский
тундровый ненецкий
удинский
удмуртский
удэгейский
ульчский
усиша-цудахарский
хакасский
хантыйский
хваршинский
цахурский
цезский
цыганский
чамалинский
чеченский
чирагский
чувашский
чукотский
чулымский
шорский
эвенкийский
эвенский
энецкий
эрзя-мордовский
эскимосский
южноалтайский
южноюкагирский (колымский, одульский)
якутский


Как теперь их искать в Сети? Можно выкачать весь Интернет и попробовать найти нужные тексты в получившейся коллекции… Но постойте, ведь на самом деле нельзя выкачать весь Интернет. То есть можно, если ты крупная IT-компания с соответствующим серверным парком и командой разработчиков. А если в твоём распоряжении маленький университетский коллектив, то тут и думать не о чем. С другой стороны, и скачивать ничего на этом этапе не нужно, ведь всю сеть уже обошли поисковые роботы. Нужно только задать поисковикам правильные запросы. Правда, поисковики не любят автоматические обращения. Но если очень попросить, то можно воспользоваться, например, Яндекс.XML, который имеет ограничения на число запросов, но всё-таки это уже не то же самое, что руками работать с поисковой выдачей.


Слова-маркеры


Но что спрашивать? Нужны слова — это ясно. Поисковые индексы формируются из слов, так что необходимо подобрать такие слова для каждого искомого языка, которые бы встречались именно в этом языке и не совпадали по составу букв ни с одним словом в каком-то другом языке. В каком-то смысле поиск языков России должен быть устроен проще, ведь почти все языки из нашего списка обладают письменностью на основе кириллицы, а это случай для мировых языков сравнительно редкий, так что вероятность совпадения двух слов из разных языков резко снижается: можно будет перепутать только слова из языков с постсоветского пространства, а слова из каких-нибудь языков Океании не будут создавать шума.


Но где взять слова? Если опять обратиться к лингвистам, то они подскажут, что есть старое и заслуженное издание — Гиляревский Р. С., Гривнин В. С. Определитель языков мира по письменностям (М., 1961 для второго издания). Каждому языку из описанных (около 200) посвящена одна страничка, где по одному шаблону приводится название языка, два коротких текста на них, алфавит, его основные особенности и сведения о числе носителей и генетической принадлежности.


Вроде бы книжка для наших целей вполне бесполезная, но на стр. 259 есть дополнительный раздел «Характерные буквосочетания и служебные слова некоторых языков». Кажется, это то, что нужно, но к сожалению, слова, которые там приводятся, очень короткие и по буквенному составу совпадают со словами из русского языка. Например, для балкарского это слово «бла», которое при поиске выдаст чудовищное количество мусора, совсем никак с балкарским языком не соотносящегося (не только бла-бла, но и «Беспилотный летательный аппарат»), а для горного марийского — «дон» (в поиске будет ещё хуже). Ну и всё-таки слова в этом разделе, скорее, редкость. А по буквосочетанию в Яндексе не поищешь.


Так предложили бы сделать лингвисты. У компьютерщиков было бы другое решение. Почему бы не взять Википедию (ведь есть же википедии на языках народов России), не сделать из неё частотник, пересечь словари, найти таким образом уникальные токены, и их использовать для поисковых запросов? К сожалению, это тоже не сработает. Во-первых, википедии есть не для всех языков России. «Настоящих» википедийных разделов, не из инкубатора, насчитывается только 22. Инкубатор добавляет ещё 41. Но обычно это максимум несколько десятков очень коротких текстов, то есть статистически значимых результатов они не дадут. Вот инкубатор с табасаранской википедией (5 статей). Вот ногайский инкубатор (23 статьи). Причём в некоторых вообще нет никакого текста, а вот тамошняя статья про башкир. И так далее.


Но и настоящие (не инкубационные) википедии не могут служить хорошим источником. Потому что они… написаны не людьми! Самые большие википедии на языках народов России страдают от того, что википедийщики называют «арахнофилией». то есть автоматическим заполнением раздела сгененированными по шаблону статьями, в которые вставлены какие-нибудь числовые данные из открытой базы или реестра. Скажем, башкирская и татарская википедии на очень маленький процент «человеческие», там десятки тысяч автоматических статей про реки и озёра. Попробуйте пощёлкать ссылку «случайная статья» в башкирской википедии, сколько раз из 10 вы попадёте не на «водную статью» (можно искать по ключевому слову «йылға» “река”)? Сейчас ситуация несколько выправилась, появились ещё статьи про страны и населённые пункты, но пять лет назад «водная» тематика была в 8 случаях из 10. Я прощёлкал сейчас, получилось 7:3 в пользу рек. А что у вас?


Всё бы ничего, но частотные слова в таких текстах вовсе не частотные слова в языке. Как выглядит «нормальный» частотный словарь, составленный на текстах естественного происхождения? Первые пару десятков позиций там занимают разные служебные слова, которые в разы чаще встречаются в речи, чем любые знаменательные. Вот частотный словарь для русского языка. Первое существительное (год) появляется там в конце третьего десятка. А перед этим всё сплошь — союзы, предлоги, местоимения и частицы. А вот частотный словарь татарской википедии за 2013 год:


Словоформа Перевод/значение Встречаемость
1 елга река 132567
2 бассейны бассейн 75706
3 су вода 54689
4 буенча по 48838
5 Русия Россия 48722
6 урнашкан расположенный 38043
7 км километр 36962
8 Һәм и 27231
9 кече малый 27203
10 дәүләт государство 26888

Тут только два служебных слова, из них только одно — Һәм “и” — действительно особенно часто встречается в настоящих текстах. Остальные, конечно, попали в перечень только из-за специфики исходной выборки.


Выход перед нами был только один: собрать слова для задания поисковых запросов вручную для каждого языка. Это экспертная работа, нужно смотреть в словари и грамматики, потом вбивать слова-кандидаты в поиск и смотреть на результат и оценивать, насколько много выходит мусора. При этом каждое слово должно удовлетворять двум обязательным критериям. Во-первых, оно должно быть частотным для своего языка. Поэтому татарское Һәм “и” подошло бы. Действительно, это слово есть в большинстве текстов на татарском языке, и запрос, который содержал бы это слово, позволил бы нам получить в выдачу и таким образом отловить большинство сайтов, на которых есть тексты на татарском языке. Во-вторых, такое слово должно быть уникальным, то есть быть в ходу только в этом языке, но ни в каком другом. С этой точки зрения Һәм, увы, «пролетает», потому что точно такое же слово есть и в башкирском.
Есть и ещё один нюанс. В алфавитах национальных языков много «специальных» символов, то есть букв, которые отсутствуют в алфавите русского языка, с помощью этих символов (как говорят лингвисты, «графем») записываются особые звуки (как говорят лингвисты, «фонемы») этих языков. Например, коми-зырянское слово таштöм содержит такой символ, далеко не самый экзотический из тех, что могут быть (другие примеры можно видеть в татарском списке «водных» слов выше).


Дело в том, что поскольку всей этой графической роскоши нет на стандартной русской клавиатуре, на которой все, в основном, и печатают, то и реальные пользователи не вводят на самом деле этих букв, заменяя их другими, похожими по написанию или по звучанию. Слово «таштöм» передают как «таштэм» или «таштом». В башкирском букву «ә» передают как «э» или «а», а букву «ҙ» как «з». Вот на КДПВ как раз слово «менан» на самом деле должно писаться «менән». Такой орфографический режим мы вслед за лингвистом А. А. Зализняком называем «бытовой системой письма». Примерно те же процессы (только без клавиатур и прочего ПО) Зализняк описал для древненовгородского диалекта, зафиксированного на берестяных грамотах.


Что это значит на практике? Что в идеале нужны не просто слова-маркеры, уникальные для этого языка и частотные в этом языке. Нужны ещё и такие слова, чтобы они не содержали этих «спецсимволов». Потому что в реальности такие символы пишут не все, и если отправлять поисковику запрос со словом в «правильной» графике, то полнота ответа получится так себе: нам не попадётся огромное число текстов, которые написаны в бытовой системе.


Кроме того, есть и более хитрые символы, например, «I»: «палочка Яковлева» (в разных кавказских языках он обозначает или гортанную смычку, или т.н. «абруптивный» звук). Часто в бытовой системе её заменяют единицей, но бывает, что пишут и символ «|», вертикальная черта, который используется как поисковый оператор «или» (поиск страниц содержащих любое из слов связанных этим оператором.).


Короче, это не просто. Но мы составили такие списки слов-маркеров для большинства интересовавших нас языков. И это единственное, что мы не выкладываем в открытый доступ, потому что такие слова ещё могут пригодиться для поиска текстов, а этот список очень легко вандализировать, например, если кто-нибудь захочет использовать их для генерации поискового спама.


Поиск


Итак, у нас есть поисковые термины, отправляем их по очереди в Яндекс.XML и получаем выдачу. Тут тоже не всё так просто. Во-первых, Яндекс.XML ограничивает наши аппетиты 10 000 запросами в сутки. Не так уж и мало? Да, но выдаёт-то он ссылки постранично (по 10 на страницу) и переход на следующую страницу считается отдельным запросом…


Кроме того, мы всё равно получаем на выходе мусор. Даже по «хорошим» маркерам. Что у нас есть? Зеркала и дубли. Особенно много дублей Википедии. А зачем нам считать Википедию, если наша цель собрать все тексты на некотором языке? Ведь Википедию можно скачать одним кликом! Что ещё? Лингвистические научные статьи. Некоторый лингвист пишет статью на русском языке и приводит в пример предложение на каком-нибудь рутульском, и это предложение содержит наше слово-маркер. Такое тоже не годится, ведь перед нами на самом-то деле текст на русском языке. Или ещё это может быть словарь. Там тоже будет слово, которое мы искали, но не будет текста. Неожиданностью для нас стали музыкальные сайты. На них лежат mp3 многочисленных народных или авторских песен на малом языке. Текстов там тоже нет, но есть подходящие под запрос короткие фразы — названия музыкальных произведений. Для некоторых языков эти сайты настолько многочисленны, что забивают всю выдачу. Мы решили, что раз мы ищем тексты, это тоже не наши клиенты.


Надо как-то отсечь лишнее. Первый фильтр можно ввести ещё на этапе обращения к поисковику. Если маркеров для языка у нас несколько, то поймав какой-то домен подному, мы можем спросить у поисковой машины, встречаются ли на том же сайте и другие слова из нашего списка. Если да, то есть вероятность, что мы попали на тот самый, нужный нам сайт. Если же один маркер там есть, а остальные не представлены, то мы с высокой вероятностью держим в руках пустышку. Есть, например, замечательное хакасское слово «пазох» («опять»). Оно удовлетворяет всем перечисленным выше критериям слова-маркера. Но вот в чём штука. Когда пишут по-русски, иногда ошибаются и печатают вместо «пазух» (носа) — «пазох». Наш фильтр поможет понять, опечатка это в русском тексте, или и правда хакасский текст. Штука в том, что это дополнительные запросы, которых и так-то мало.


Не всё однозначно и со списком сайтов, на которых нашлись нужные нам тексты. Если мы планируем не просто найти эти сайты, но и выкачать их, чтобы составить корпус, то нам надо знать глубину, на которую потом следует производить выкачку. Мы поделили все найденные домены на три категории (всё это тоже можно узнать, задавая правильные запросы Яндексу).
В первую попали те, на которых много (предположительно — большинство) страниц содержат тексты на интересующем нас языке.


Во второй оказались те, на которых есть несколько (не слишком много по сравнению с общим числом страниц) документов на интересующем нас языке.


К третьей мы отнесли те огромные сайты с миллионами страниц, на которых в том числе есть и интересующий нас контент. Это Youtube (в подписи к какой-нибудь видеозаписи есть текст на «нашем» языке) или stihi.ru (там публикуются, например, чеченские поэты).


Кроме того, мы специально спрашивали у Яндекса про то, где он находит интересующие нас слова в социальной сети VK.com. Из полученных страниц отбирали только сообщества, потому что считали, что в среднем двуязычный пользователь, скорее, будет общаться на своём языке в специальном месте (в этом самом сообществе), а на собственной стене будет писать, скорее, по-русски, уважая чувства русскоязычных друзей. Это, конечно, не всегда так. Но в целом так.


Определение языка


В результате мы получили списки сайтов и сообществ в VK.com. Сейчас эти списки уже устарели: какие-то сайты пропали, какие-то добавились, гораздо интенсивнее происходит жизнь в vk.com. Но по состоянию на начало 2016 года это довольно правдивая информация о том, как устроен Интернет на малых языках России.


Следующим шагом было всё это скачать. С задачей мы в полной мере не справились. Выкачку многих десятков разнообразных сайтов для крупных языков вроде татарского или удмуртского, нам так и не удалось поставить на поток. Scrapy ломался, зависал. А вот сообщества из VK мы выкачали по API все и полностью.


Но выкачать мало. Нужно ещё определить, что именно мы скачали. Сайты, которые содержат интересующий нас контент, почти никогда не бывают моноязычными. Чтобы получить корпус текстов, которые затем смогли бы использовать лингвисты, а также чтобы понять, насколько тот или иной язык представлен в Интернете, нужно очистить полученные веб-страницы от обвязки и от текстов на других языках. Обычно в компьютерной лингвистике для этого применяется статистика распределения знаков (чаще — последовательностей знаков, ngram) в тексте. Если у нас уже есть какой-то корпус текстов на разных языках, мы можем натренировать на нём модель, и дальше успешно определять, какой язык перед нами. Но проблема в том, что у нас как раз такого заранее заданного корпуса нет. Мы только пытаемся его сделать.


Но если вдуматься, то всё-таки всё не совсем так. У нас, скорее всего, есть два языка, отличия между которыми мы должны найти. Один язык — некоторый малый язык (без разницы, якутский или чувашский), а второй — русский. Их мы и должны отделить друг от друга. В таком виде задача уже приобретает выполнимые очертания. Ведь русский-то язык у нас есть в качестве «подопытного» в большом количестве. То есть нам нужно про каждый, скажем, абзац текста сказать, написан он на русском языке или нет. Если не на русском, значит, это наш клиент.
Определялка не везде и не всегда работала хорошо, но в целом, скорее, удовлетворительно.


Результаты


Итак, у нас есть тексты. У нас есть данные о сайтах и сообществах. Что с ними теперь можно сделать?


Как минимум, можем выполнить самую базовую программу и отдать собранные тексты лингвистам. У нас уже есть корпуса бурятского, удмуртского, татарского, хакасского языков. Их можно пополнить «настоящими» текстами из дикой природы. Лингвисты такие любят.
Но ещё можно что-то попробовать понять про представленность самого языка в Сети. Много там текстов на этом языке или мало? А если сравнить с тем, как живёт язык в оффлайне, то его интернет-самочувствие выглядит так же или не так?


Сайты


Для начала посчитаем, сколько вообще сайтов (доменных имён) получается на каждый язык.


Число доменов на язык


А кем они регистрируются? Это вообще всё частная или государственная инициатива — выкладывать тексты на малых языках в Интернете?


Кто регистрирует домены с текстами на малых языках


В принципе, какие-то активисты есть, но большей частью ответственность здесь на организациях.


А когда сайты регистрировались?


Когда регились


Видно, что процесс шёл по нарастающей, но после 2012 года наступил резкий спад. Почему? Наверное, потому что вся активность подобного рода перетекла в набравшие авторитет социальные сети. Прежде всего, в vk.com.


Теперь попробуем анализ данных. Вот у нас есть показатели для языка в онлайне: количество статей в Википедии, данные из Вконтакте (количество сообществ, объём текстов). И у нас есть показатели для языка в оффлайне (прежде всего, число носителей, но не только, ещё есть кое-какие экономические показатели регионов, в которых большей частью живут носители языка). Есть ли между этими группами показателей корреляция? А есть ли корреляция внутри группы показателей?


Оказывается, что между всеми онлайн-параметрами корреляция Спирмена довольно высокая (выше 0.7), а вот онлайн-параметры с оффлайновыми не коррелируют. Это значит, что в онлайне язык живёт по своим законам, и что там происходит в Интернете, от числа носителей не зависит. В общем, это логично, мы знаем, что есть правило одного процента. И важно не то, насколько этот процент большой, а насколько он активен. Есть небольшие языки с активным процентом, а есть языки побольше, среди носителей которых активистов не так много или они не такие уж и активисты.


Теперь посмотрим, насколько связаны между собой сайты на разных языках. Составляют ли малые языки замкнутую на себя систему или каждый язык представляет отдельную экосистему? Построим граф, в котором будем учитывать ссылки со страниц, на которых мы находим текст на одном языке, на страницы, на которых есть текст на другом языке.


кто на кого ссылается


Примечание про петли в графе

У многих языков-вершин есть "петли", это значит, что для этого языка мы видим сайты, которые дают ссылки на сайты на этом же языке. Но петель нет для больших языков, для которых это было бы ожидаемо: татарский, башкирский, удмуртский, якутский. Этих петель нет не в реальности, а в наших данных, потому что мы сайты на этих языках не выкачивали и не знаем, кто и на что там даёт ссылки.


Оказывается, это очень даже внутренне связанный мир. Приятно знать, что народы, как писал поэт, распри позабыв, в великую семью соединились, и единение это произошло в пространстве Интернета.


Как вообще языки похожи или не похожи друг на друга, если взять всё-всё, что мы про них знаем и по этим параметрам кластеризовать?


кластеризация


Здесь, в общем, очевидные две группы языков: более-менее благополучные, на которых есть носители, и эти носители пишут что-то в Интернете, и неблагополучные, витальность которых в Интернете слабо заметна.


Социальные сети


Теперь посмотрим на то, что мы знаем из текстов в vk.com. Узнать оттуда вообще-то можно много чего, ведь пользователи не только пишут на каком-то языке, но и сообщают про себя разную полезную для лингвистов информацию: возраст, место проживания и проч. Так что здесь данных много. Но выполним хотя бы первый подход к снаряду.


География постов:


География


В основном, те, кто пишут на малом языке, живут в своём регионе, вероятнее всего — в столице. То есть пишущие на башкирском живут в Уфе, пишущие на удмуртском — в Ижевске. Это не так для совсем маленьких, почти вымерших языков типа южноюкагирского, их носители живут в Москве. Если это не чукотский. У русского Севера больше связи с Питером, северяне предпочитают северную столицу.


Что мы ещё знаем про типичного пользователя-носителя миноритарного языка?


  • Возраст: 19-31;
  • Место проживания: титульный регион;
  • Являясь носителем миноритарного языка, в основном «говорит» по-русски;
  • Вероятнее всего, принимает участие в жизни только одного сообщества.

Типичное сообщество, «говорящее» на миноритарном языке:


  • Треть всех постов написана на миноритарном языке;
  • Длина текста на миноритарном языке в среднем около пяти слов.

А зависит ли в социальной сети число сообществ от числа говорящих на языке вообще?


Число говорящих и сообществ


В целом как-то не очень. Много есть башкирских сообществ, больше, чем мы бы ожидали от языка с таким числом носителей. Чеченских сообществ, наоборот, меньше ожидаемого. Но тут надо помнить, что интернетизироваться этот регион стал позже других вследствие известных событий 90-х и начала 2000-х.


Итак, мы узнали, что малые языки России в Интернете есть. Они живут на сайтах и в социальных сетях, а с 2012 года преимущественно в социальных сетях. И там, и там они вынуждены выдерживать жёсткую конкуренцию с «престижным» русским языком. Витальность языка в Интернете мало зависит от того, сколько говорит на этом языке «в жизни». Важнее то, сложилось ли вокруг этого языка активное сетевое сообщество, действующее на престижных интернет-площадках (Википедия, Вконтакте). Если оно сложилось, то это произошло «на местах», в регионе, где живут носители этого языка.


Ну а получится ли у малых языков выжить в ситуации глобализации, нам предстоит узнать ещё при нашей жизни.


Весь код проекта лежит в репозитории. Все текстовые коллекции и списки доменов и сообществ доступны для скачивания.


А ещё не могу не порекомендовать сообщество в vk.com с няшными мемасиками на малых языках с котиками.

Поделиться публикацией
Никаких подозрительных скриптов, только релевантные баннеры. Не релевантные? Пиши на: adv@tmtm.ru с темой «Полундра»

Зачем оно вам?
Реклама
Комментарии 1058
  • 0
    Шедеврально! Фундаментальная работа! А скажите, есть ли какие-то проекты по… ну, скажем так, по сохранению малых языков. Вот есть далёкое селение, где осталось два старика, а вся молодёжь с конца 70-х ещё перебралась в Москву и говорит по-русски. Эти два старика умрут — и язык прекратит своё существование. А вот если бы был какой-нибудь цифровой музей языков… Есть же технологии синтезирования речи.
    • +1
      Есть такие проекты. Это называется «ревитализация». Только они не очень работают, кажется.
      Есть и «цифровые музеи», например, такой: www.endangeredlanguages.com
      • 0

        Я не специалист по этому вопросу, но как пользователь вижу, что качество синтеза речи для разных языков очень отличается. Видимо, нельзя так просто переучить голосовой движок на новый язык. А если носителей этого языка осталось пара стариков…

        • 0
          Разница между синтезированной речью и записью настоящего носителя в любом случае огромна. Примерно как между настоящей картиной Леонардо и грубой подделкой XX века.
          • 0

            Я бы сказал, даже намного больше. О языке это мало что потомкам скажет.
            Но я о том, что даже разница между синтезаторами английского и русского не в пользу последнего, хотя над ним-то работы интенсивные ведутся, а какие шансы у вымирающего языка?

      • 0
        Про синтез не знаю, но еще начиная со времен СССР идет сбор наследия, в том числе в записях. Поспрашивать можно на филологических факультетах местных пединститутов, либо (что даже лучше) в местном институте культуры. В этих институтах практически везде есть кафедра народного творчества и там найдутся записи местных песен, поговорки, шутки и прибаутки… Но, к сожалению, часто всё это лежит мертвых грузом где нить на полке в кладовке и хорошо, если есть кому заниматься приведением этого богатства в надлежащий вид.

        PS. У меня знакомый занимался в местном институте культуры оцифровкой и очисткой записей. Говорит, что качество магнитных лент после десятилетий неправильного хранения оставляет желать лучшего. Тем более, что многие ленты записаны не профессионалами, а студентами в этнографических экспедициях на бытовые магнитофоны.
        • +1
          Записи есть не для всех языков. Для некоторых языков записей слишком мало.
          Но сохранить язык во всей полноте никакие записи не могут.
          • 0
            а почему именно VK использовали?
            • 0
              На момент начала проекта провели некоторую пилотную разведку и обнаружили, что искать имеет смысл именно там. На все соцсети ресурсов не хватило, надо было выбирать.
        • +2
          А нужно ли сохранять то, что умерло естественным путем за ненадобностью?
          Сохранить книги, какие-то тексты, это понятно, для истории. Но то, что происходит сейчас в республиках, когда школьников заставляют учить мертвые языки, на которых говорят только древние бабушки в глухих деревнях, зачастую заставляют учить в ущерб русскому языку и другим предметам, я считаю неприемлемым. Да и по весьма неоднозначному (скорее даже однозначно негативному) отношению к обязательному изучению этих языков можно сделать некоторые выводы. А топят за это все в основном местные националисты, для которых их деревня — центр мира.
          Да и подходя к вопросу с логической точки зрения, какой смысл учить язык, на котором говорят, дай бог, если сотня тысяч человек во всем мире, а то и меньше, а людей говорящих исключительно на этом языке и не знающих при этом русский и вовсе практически нет.
          • +3
            Как Вы лихо определили, что надобно, а что не надобно!
            А какой именно язык Вы имеете в виду, когда говорите, что он мёртвый и что говорят на нём только бабушки в деревнях? Вообще-то если жив хотя бы один носитель (не надо бабушек оскорблять!), то язык не мёртв. Но всё равно — Вы о каком языке? Может быть, о татарском, на котором говорит несколько миллионов (!) человек? Он, между прочим, входит в первую сотню самых распространённых языков мира.
            Не знаю, как там националисты, но вот те, кто понимает ценность языка и культуры, солидарны в том, что они требуют сохранения. И специалистам по теме очевидно, что важный способ помочь в этом — сохранить преподавание в школах.
            Подойдя с логической точки зрения Вы забыли о таких важных вещах, как самосознание народа, этническая идентичность, которые не нужно списывать со счетов.
            Но вот языков, на которых «говорит сотня человек» никто и преподавать не будет, такие языки уже, можно считать, практически вымерли, и им ничто не поможет. И это огромная потеря для человеческой культуры. Вы даже не представляете себе, насколько большая.
            • 0
              Как Вы лихо определили, что надобно, а что не надобно!

              Не я определел, я лишь делаю выводы по обсуждению этого в интернетах и по словам знакомых.

              А какой именно язык Вы имеете в виду, когда говорите, что он мёртвый и что говорят на нём только бабушки в деревнях?

              Например чувашский, и это, хочу заметить, далеко не самый маленький язык, есть и куда меньше.

              Не знаю, как там националисты, но вот те, кто понимает ценность языка и культуры, солидарны в том, что они требуют сохранения.

              Да и я как бы не против, пусть сохраняют. Только не против воли и не в ущерб русскому, не таким способом. Все, что я вижу после такого насильного «сохраниния», лишь отрицательное отношение к языку у тех, кто раньше был к нему нейтрален. От такого «сохраниния» попросту не будет прока, это только внесет раздор между представителями этих народов и простыми русскими.
              • +3
                Вы говорите, что нечто умерло естественным путём за ненадобностью. Если оно умерло, то не обязательно за ненадобностью. Ненадобность — это уже как раз Ваше решение.
                На чувашском говорит больше миллиона человек! С чего вдруг следует считать его мёртвым?
                Да нету там никакого ущерба русскому. Это всё фантазии какие-то.
                • +2
                  Малые языки безусловно интересны с точки зрения антропологии, человеческой истории и культуры, лингвистики и даже в исследованиях принципов работы мышления и разума. Но с точки зрения развития цивилизации в целом было бы идеально, если бы все люди планеты вообще разговаривали на одном языке. Подумайте, сколько существует в мире интереснейшей информации, которую вы никогда не узнаете — просто потому что она к примеру на китайском. Переводчики переводят далеко не все. А если вы захотите погуглить или пообщаться на местном форуме — то тут уже нужно личное знание языка без вариантов.
                  • +1
                    Есть известное разделение на культуру и цивилизацию, сформулированное, кажется, Шпенглером. С точки зрения такого понимания цивилизации, конечно, Вы правы. Но с точки зрения культуры из той же оппозиции это огромная потеря. Для культуры та информация, которую мы потеряем в результате гибели языка ценнее той информации, которую не переведут переводчики с китайского.
                    Идеально было бы только в терминах антиутопии. Чего-нибудь типа фильма «Эквилибриум» или «Мы» Е. Замятина. Там тоже изображён некоторым образом идеальный мир. Но жить в нём не хочется.
                    • 0
                      Для культуры та информация, которую мы потеряем в результате гибели языка ценнее той информации, которую не переведут переводчики с китайского.
                      А обоснование этому есть? Или просто очередной постулат? Опять же, ценнее для кого? Очевидно же, что «уеннее для культуры» — бессмысленное выражение, тк культура не является субьектом.
                    • +1
                      >> Но с точки зрения развития цивилизации в целом было бы идеально, если бы все люди планеты вообще разговаривали на одном языке.

                      С точки зрения языковой практики такого не будет никогда. Я не буду апеллировать к праязыкам, которые в свое время разошлись на 100500 диалектов. Я всего лишь напомню ситуация с английским — британским английским, от которого отпочковались и существуют по своим внутренним законам американский и австралийский английский, в которых разница уже не на уровне лексики, а куда глубже. В общем, мечта про «всемирное эсперанто» — недосягаемае мечта, ибо в этом эсперанто через Х лет начнут появляться свои диалекты, которые начнут трансформироваться в отдельные языки.
                      • +1

                        Тем не менее британцы понимают американцев, а американцы — австралийцев. И все понимают индусов, кроме меня. Даже Siri их понимает)

                        • 0
                          Разделение английского на разные ветви не так давно произошло, впрочем. Пройдет ещё какое-то время и британский, американский и австралийский английский будут отличаться также, как сейчас отличаются русский, белорусский и украинский — основа этих языков вроде одна, направления развития разные.
                          • +1
                            Не будут они ещё дальше разделяться.
                            Причины две: Голливуд и интернет.
                            • 0
                              >> Голливуд
                              Вспоминаем первую часть «Безумного Макса», которого для мирового проката полностью переозвучивали с австралийского на американский. Вы недооцениваете локальные рынки — огромное количества продукции (фильмы, книги и др.) создаются в первую очередь такими рынками для таких же рынков.

                              >> интернет
                              Ну и заодно давайте вспомним, как Майкрософт для Windows 10 выпустила локализацию на британский английский. Хотя казалось бы в чём проблема англичанам пользоваться оригинальной американской локализацией. Раньше же как-то пользовались и не гудели :-)
                              По бразильский португальский я скромно промолчу — давно уже во многих продуктах присутствуют локализации на обеих версиях португальского. Казалось бы зачем?
                              • +1
                                Это параллельные явления. Вспомните тогда уж и про кучи желающих смотреть все на языке оригинала. У меня, например, на всех личных устройствах стоит английская локаль. Вы можете сказать, что это фетишизм, но нет — так просто удобнее гуглить, смотреть туториалы и тд. + единообразие и отвязка от кривых локализаторов.
                                • +1
                                  >> У меня, например, на всех личных устройствах стоит английская локаль.
                                  Это т.н. профессиональная деформация — присутствует практически у всех ИТ-шников. Но нельзя мерить потребности и свойства рядового представителя этнической группы потребностями узкой общности этой же группы.

                                  >> Вспомните тогда уж и про кучи желающих смотреть все на языке оригинала.
                                  Это практически никак не связано с малыми языками. Это в первую очередь проблема постсоветского дубляжа, когда актёры озвучки делают свою работу халтурно. Ряд фильмов, несмотря на чумадан разных русских озвучек до сих пор не имеет нормального перевода — тот же «Джонни-Мнемоник».
                                  • +4
                                    Я не ИТшник. Просто на русском нет ничего дельного в интернете ни в какой из интересных мне областей. То есть, в какой-то момент я разочаровался в рунете и стал гуглить сразу на английском. О боги, как снобски звучит, ну да ладно.

                                    Просто в один прекрасный день у вас встает выбор, читать оригинал новостей или их кривой перевод редакторами ГТ. Что по сути эквивалентно
                                    Это в первую очередь проблема постсоветского дубляжа
                                    А еще оригинальная игра актеров, непереводимый юмор и тд. В общем, несмотря на какой-то обьем переводов между разными подъязыкам, будет все равно сохраняться огромный массив непереведенного контента. А значит. постоянно будет происходить перемшивание и взаимозаимствование.
                                    • +1
                                      >> То есть, в какой-то момент я разочаровался в рунете и стал гуглить сразу на английском. О боги, как снобски звучит, ну да ладно.
                                      Нормально звучит, не волнуйтесь. Мне, собственно, владея четырьмя языками, ничуть не мешает также искать что-то на английском и общаться на своем малом языке ;-)

                                      >> А еще оригинальная игра актеров, непереводимый юмор и тд
                                      Всё-таки проблема постсоветского дубляжа — при Советах одну роль могли дублировать две-три недели, работая полный рабочий день, сейчас на роль обычно отводится 3-4 часа. Удивляться, что качество современной русской озвучки практически никакое, незачем.
                                      Непереводимый юмор адаптируется (где-то с трудом, где-то достаточно легко), иначе бы комедии не дублировали вообще.
                                      • 0
                                        Специфический юмор сильно портится. Комедии содержат много не специфического, и потому выглядят вес равно смешно. Но какой-нибудь south park на русском уже не тот.
                        • 0
                          Причина разделения языков на 100500 диалектов — расстояние.
                          Сейчас расстояние не играет такой роли, и это множество диалектов (языков) в наши дни только мешает обмену информацией.
                          • +1
                            Расстояние для образования и существования диалектов — мало обязательное условие. Примеров тому множество — баварский диалект немецкого или питерский диалект русского. Если в случае со вторым (питерский в сравнении с литературным русским) разница в небольшом отличии в произношении и совсем небольшого пласта лексики (поребрик, холодный кипяток и пр.), то баварский немецкий весьма и весьма отличается от немецкого литературного (грамматика, лексика и пр.), несмотря на то, что он существует, грубо говоря, под самымм боком у основной массы немецкоговорящих.

                            >> в наши дни только мешает обмену информацией
                            так было всегда и всегда будет.
                            • 0
                              Скажите это грекам где деревня о 300 домах говорит на своём собственном языке — вполне себе реальная ситуация. Или итальянцам у которых в каждой из 20 провинций главенствует свой язык, хотя расстояния смешные по нашим меркам.
                              • 0
                                Значит были другие причины для изоляции кроме расстояния. Может враждовали как Монтекки и Капулетти.
                          • +1
                            Но с точки зрения развития цивилизации в целом было бы идеально, если бы все люди планеты вообще разговаривали на одном языке. Подумайте, сколько существует в мире интереснейшей информации, которую вы никогда не узнаете — просто потому что она к примеру на китайском. Переводчики переводят далеко не все.

                            А вот тут не соглашусь с автором. Просто общаться, чтобы было меньше проблем при достижения договоренностей в плане различия языка и культур, да. Но насчет «выкинуть» другие языки… Есть много понятий в одном языке, которых просто нет в другом. И попытка передать их «другими словами» все равно не дает то многообразие оттенков на эмоциональном уровне, которое чувствует настоящий носитель языка. Примеров много. Найти их несложно.
                            Да, переводчики переводят далеко не всё. Я, например, с романистом Консаликом познакомился только на немецком языке. Но это уже просто дело времени и финансов перевести «всё-всё». А вот ощущение понимания речи и выражений, когда ты их слышишь и понимаешь на том самом языке, совершенно иное. Давая языкам умирать, мы лишаем себя огромного человеческого эмоционального состояния, которое они могли дать.
                            PS: По возможности я читаю иностранных авторов в подлиннике не для того, чтобы выпендриться, а для того, чтобы прочитать автора, а не его интерпретацию переводчиком, как бы точна и красива она ни была. Мне, например, Шиллер и Гете нравятся намного больше в оригинале, хотя у того же Лермонтова есть гениальнейшие переводы, которые я читаю уже, как самостоятельные произведения.
                      • +1
                        Но если эти языки правда нужны, то почему никто не хочет на них говорить? А если все хотят, то почему им требуется искуственная поддержка?
                        • +1
                          Хотят, хотят на них говорить.
                          Поддержка требуется потому что языки не существуют в вакууме. На них оказывается мощное давление. Это давление и нужно облегчить.
                          • +1
                            Не вижу логики. Вот хочу я говорить на английском и говорю, как можно мне помешать? Захочу говорить на польском — выучу польский. Ну да, вокруг одни русские, ну и что? Мне-то это как мешает?
                            • 0
                              Если вокруг одни русские, с кем Вы будете говорить по-польски?
                              Но речь не о том, чтобы выучить новый язык. Речь о том, чтобы не забыть свой родной. Если его не преподают в школе, если на нём не издают газет, Вы будете считать его не престижным. И у Вас не будет времени и мотивации на нём общаться. Постепенно будете забывать. А потом через 20 лет совсем забудете. Но при этом вдруг проснётся жажда самоопределения, попытка понять, «кто я?» и «где я?», потянет к истокам, к своим родным, к своей культуре. А язык-то забыт, и будет мучительно больно, что 20 лет назад не занимался этим языком, хотя бы даже из-под палки.
                              • +3
                                С поляками. Интернет большой, а польки милые. В чем вы видите проблему?
                                Речь о том, чтобы не забыть свой родной.
                                А если забуду, чем это плохо?
                                у Вас не будет времени и мотивации на нём общаться.
                                Но вы же говорите, что все наоборот хотят общаться на обсуждаемых языках.
                                «кто я?» и «где я?»
                                Гражданин Мира?
                                • –1
                                  Поляки довольно вредные.
                                  Проблему я вижу в том, что Интернет не обеспечивает потребность в общении полностью. Общаешься в первую очередь с теми, кто вокруг.
                                  Забыть плохо тем, что потом забывший человек будет об этом горевать, а время будет упущено.
                                  Да, я говорю, что на обсуждаемых языках хотят общаться. Но не обязательно с самого раннего возраста. По мере взросления, осознания себя, потребность в самоидентификации усиливается.

                                  Гражданин Мира?


                                  С возрастом это проходит.
                                  • +1
                                    Ну на знаю, поляки меня любят, все хорошо.
                                    Проблему я вижу в том, что Интернет не обеспечивает потребность в общении полностью.
                                    Ну так вопрос приоритетов. Если я вдруг проснусь с осознанием, что видеть поляков мне дороже всего в жизни, то перееду в Польшу. Если решу, что хочу больше общаться с бурятами — перееду куда-нибудь под Цугол.
                                    Да, я говорю, что на обсуждаемых языках хотят общаться.
                                    Ну так кто им мешает-то?
                                    • 0
                                      В каком-то идеальном мире можно так абсолютизированно поставить вопрос приоритетов. В нашем реальном мире всё сложнее.
                                      Зачем ставить людей перед таким сложным выбором, чтобы они вынуждены были решать, что для них в жизни самое главное? Это не очень гуманно.
                                      Ну так кто им мешает-то?

                                      Обстоятельства.
                                      • 0
                                        Ну такова жизнь, с этим ничего не поделать — всегда нужно что-то выбирать.
                                        Обстоятельства.
                                        Какие?
                                        • 0
                                          Да я, вроде, выше там приводил примеры.
                                          Быт, знаете ли, заедает.
                                          • 0
                                            А можно как-то конкретнее? Если правда приводили, то ссылку на комментарий.
                                            • 0
                                              Правда приводил. Вот такая ссылка на комментарий.
                                              • 0
                                                Ну это не убедительно. Это скорее говорит в мою пользу, чем в вашу.
                                                • 0
                                                  Нет, не говорит в Вашу пользу. У Вас мир какой-то одномерный. Просто машина Тьюринга. Хочешь — сделай. Не сделал — не хотел. Жизнь так не работает. В ней множество факторов одновременно действует.
                                                  • 0
                                                    Вы утверждаете, что люди хотят свой язык, но приводите пример того, как они же сознательно выбирают другой. Да, это именно подтверждение моей позиции. Мы же не в каменном веке живем — распространение и потребление информации ничего не стоит.
                                                    • –1
                                                      Они выбирают другой язык, но не сознательно, а под давлением обстоятельств. С информированным согласием это ничего общего не имеет.
                                                      Мы живём в нашем веке. Распространение информации ничего не стоит, но очень дорого стоит время на производство информации и организацию сопутствующих процессов.
                                                      • 0
                                                        Значит, не так уж и хотят. Примерно, как я хочу норвежский выучить.
                                                        • 0
                                                          В мире машины Тьюринга можно было бы сказать так.
                                                          Но в реальном многомерном мире, конечно, это ложная характеристика ситуации.
                                                          • 0
                                                            Ну конечно же истиная.
                                                            • 0
                                                              Нет, конечно. Это что-то из разряда «вот если вы против несправедливости, то надевайте костюм Бэтмена и идите с ней бороться на улицу. Что? Не идёте? Нет костюма? Завтра рано вставать и на работу надо? Так это вы просто не против несправедливости!»
                                                              • 0
                                                                Не корректная аналогия.
                                                                • –1
                                                                  Нет, это именно то, что Вы предлагаете. С Вашей точки зрения носители малых языков должны преодолевая все жизненные обстоятельства (какие угодно от низкой зарплаты до семейных неурядиц), сквозь кровь и пот упорно трудиться для того, чтобы поддерживать витальность своего языка. Как конь Боксёр из «Скотного двора». И только так они действительно докажут, что они хотели сохранения своего языка.
                                                                  Всё это очень одномерное представление о жизни.
                                                                  • +1
                                                                    Да какие обстоятельства-то? Какая кровь и пот, о чем вы? Это же просто язык. Хочешь — говоришь, не хочешь — не говоришь. Даже с дивана вставать не надо. Что вы собрались преодолевать?
                                                                    • –1
                                                                      Нет, это не просто язык. Это преподавание в школах, это газеты, это паблики в социальных сетях, это радио, это много чего ещё.
                                                                      «Хочешь — говоришь, не хочешь — не говоришь» — это, увы, некорректное упрощение. Что-то вроде «ну а что там за дело построить ракету? подумаешь! делов-то: взял топливо, окислитель, смешал в камере сгорания и полетели».
                                                                      Это так не работает.
                                                                      • +3
                                                                        Ерунда полнейшая. Газеты, радио и ТВ не нужны. Пол жизни не пользуюсь ни чем из этого. 90% контента потребляю на английском, и ни какое русскоязычное давление этому не мешает. Размещать же саой контент в интернете ничего не стоит. И если говорить об интернете, то в нем русский далеко не доминирует, то есть опять мимо. Человек сам создает вокруг себя информационный и культурный пузырь, общаясь с тем, с кем ему интересно и потребляя тот контент, который интересен. И ничто не может этому помешать. А ваша аналогия снова не корректна.
                                                                        • 0
                                                                          Нет, к сожалению, не ерунда. Нужны и газеты, и радио, и ТВ. Для того, чтобы это понять, нужно всё-таки исходить не из своего положения, а из ситуации носителя малого языка.
                                                                          Размещать свой контент в Интернете — стоит. Это стоит времени. А время стоит дорого.
                                                                          • 0
                                                                            Вы как-то раскройте что ли мысль. А то, одни постулаты.
                                                                            • 0
                                                                              >> Вы как-то раскройте что ли мысль. А то, одни постулаты.
                                                                              Проблемы малых две:
                                                                              первая — обычно недостаточно (если мы не уводим детей в абсолютную изоляцию) достаточно сопуствующего материала (аудио и видео-, плюс печатка) для детей, необходимого для нормального естесственного существования и восприятия его ребенком-носителем;
                                                                              вторая — при втором этапе «поднятия» языка (подростки и молодёжь) снова нет достаточного кол-ва тех самых материалов.
                                                                              Обе проблемы существуют, т.к. для их решения нужен чумадан денег и ведро времени (с). Преобладающие в России языки (он, собственно, один — русский) не заинтересованы в решении этих проблем, несмотря на то, что носители малых языков — такие же налогоплательщики, как и русскоязычные. То есть ситуация сводится к тому, что все скидываются в общий котёл, но из котла этого кормится только одно «горло».
                                                                              Хотя, как показывает трёхсотлетняя практика, русский язык очень мало стоек к влиянию других языков — его без проблем поочередно «насилует» то немецкий (Петр 1 и сотоварищи), то французский (19 в.), то сейчас английский (мое любимое русское слово — мерчендайзинг; как видно у «великого и могучего» не хватает внутренних ресурсов языка для описания существующих явлений).
                                                                              • +2
                                                                                О Боги, а как раньше-то эти языки существовали, когда радио и телевизоров не было?

                                                                                Я вам скажу, в чем на самом деле проблема: потреблять ино(русско?)язычный контент они хотят больше, чем сохранять свой язык.

                                                                                Казалось бы, чего такого, мы же смотрим голивудские фильмы вместо своих, да? Но штука в том, что желающие посмотреть каких-нибудь очередных мстителей измеряются многими тысячами (если не миллионами), и им не проблема скинуться (методом покупки билета в кино, например) на перевод для себя. В то же время каким-нибудь эвенкам скидываться на перевод полнометражки будет, мягко говоря, дороговато.

                                                                                В итоге мы получаем, что у них есть выбор: сохранить свой язык и жить в информационном пузыре (в котором ничего нет, тк их пара сотен человек всего, и неоткуда взяться всему этому) или же сломать пузырь и потреблять культуру кого-то побольше в любых желаемых количествах (а не 1 новый фильм раз в 50 лет).

                                                                                Ну и раз мы тут дискутируем о спасении языков, то очевидно, выбор сделан. Искуственно спасать языки значит загнать людей в культурную изоляцию. А иначе не хватит ни каких денег всего мира чтобы сделать достаточную культурную среду для этих языков. Это ж нам нужен свой Удмурталивуд, удмуртапедия, удмуртугл, удмуртософт с удмуртобуком и тд, верно? Ведь именно это понимают идейные сторонники спасения языков, когда говорят о недостатке денег. м?

                                                                                Также не надо забывать, что в масштабах мира даже русский язык является малым и не может полноценно конкурировать с английским по количеству контента. Даже при том, что на русский постоянно контент скидываются 100+ миллионов людей. Представьте, насколько больше придется скинуться чтобы обеспечить хотя бы равный (а иначе смерть их самобытной культуры станет вопросом времени) уровень потребления всем этим малым народам. Вы готовы к таким затратам? Лично я нет. Я даже на русский язык скидываться не готов (и потому потребляю бесплатный английский в интернете). Такие дела.
                                                                                • +2
                                                                                  Подробно весь ваш комментарий не буду комментировать — приблизительно то же я говорил другому комментатору: у разных языков разныя языковые категории и в честной живой конкуренции, скажем, чувашский не может конкурировать с русским, как в то же время русский не может конкурировать с английским или китайским.
                                                                                  Сохранение малых языков достигается его сохранением в первую очередь на бытовом уровне. «как раньше-то эти языки существовали, когда радио и телевизоров не было?» — там сто лет назад и мир совсем другой был, и потребности (можно также задаваться бессмысленным вопросом как СССР существовал до 1962 г. без туалетной бумаги :-) ). Сейчас, как ни парадоксально, огромный вклад в сохранение малых языков вносит (сюрприз!) Майкрософт (а вследь за ними Самсунг и Гугль) — для захвата новых рынков (чистый капитализм, сэр!) они взялись обеспечивать локализацию своих продуктов (Windows, Office) и сервисов на малые языки, вплоть до языка индейцев навахо. В ситуациях, когда железо и софт разных конкурентов практически идентично по функциональности и производительности, поддержка своего языка в интерфейсе является одной из главных причин выбора между конкурирующими продуктами.
                                                                                  • 0
                                                                                    Так я как раз это и говорю. Если язык не нужен на бытовом уровне самим носителям, то нужно ли его сохранять?
                                                                                    • +1
                                                                                      Вы, наверное, очень узко понимаете значение слов «бытовой уровень». Бытовой уровень — это не только разговаривают ли на этом языке люди дома или нет. Это и обучение в школе (изучение, скажем, некоего тарандайского языка в школе в Тарандии по два часа в неделю и при этом преподавание остальных предметов, скажем, на русском — тоже бытовой уровень), и контакты с остальными госструктурами (ситуации, когда в стране два госязыка — тарандайский и русский — и когда заявление на тарандайском не принимает барышня, которая не знает тарандайского с требованием «перепишите на нормальном языке» — тоже бытовой уровень), и много другое.
                                                                                      Плюс давно наступила цифровая эпоха. И достаточно сильным ударом для любого малого языка будет отсутствие символов нацписьменности в шрифтах (с Уникодом сейчас вроде всё ОК, но еще лет десять назад с этим было весьма плохо) и раскладки клавиатуры из «коробки».
                                                                                      Даже такая ситуация, как отсутствие в продаже клавиатур с нацсимволами неплохо бъёт по языку на бытовой уровне — как пример белорусский: ну не выпускают клавиатуры с белраскладкой (нет на клаве букв І і Ў). В результате достаточный пласт людей не знает, как набрать на клавиатуре Ў (находится на той же клавише как и русское Щ).
                                                                                      • –1
                                                                                        Это все ерунда. Физика в школе есть 2 часа в неделю, но взрослые ее не знают. Так и тарандайский знать не будут. Сохраняются только те знания, которые востребованы и постоянно используются.
                                                                                        «перепишите на нормальном языке»
                                                                                        Нормальное, кстати, требование. Не может же служащий знать все окрестные языки, правильно? А если надо будет эскалировать вопрос на уровень региона?
                                                                                        отсутствие в продаже клавиатур с нацсимволами
                                                                                        Был бы спрос — сделали бы. Хотя бы наклеечки. Микрософт же сделал винду для них, как вы выше сказали. Бизнес же. Захват рынков, м?
                                                                                        • +1
                                                                                          >> Был бы спрос — сделали бы. Хотя бы наклеечки. Микрософт же сделал винду для них, как вы выше сказали. Бизнес же. Захват рынков, м?
                                                                                          Наклейки найти можно. Ну и не следует сравнивать электронные товары и физические в данном случае — клавиатуры могут просто не возить российские поставщики (им в России это нафиг не надо, в результате если производитель и производит их, то конечный потребитель их не получит).

                                                                                          >> Нормальное, кстати, требование. Не может же служащий знать все окрестные языки, правильно? А если надо будет эскалировать вопрос на уровень региона?
                                                                                          Неправильно. Особенно учитывая тот факт, что в законодательстве прописано, что госслужащий должен владеть обеими госязыками. Но наличие таких законов не мешает саботировать их выполнение. Проходили, знаем.

                                                                                          >> Это все ерунда. Физика в школе есть 2 часа в неделю, но взрослые ее не знают. Так и тарандайский знать не будут. Сохраняются только те знания, которые востребованы и постоянно используются.
                                                                                          Если язык основной этнической группы преподавать два часа в неделю, то да, знать не будут. Если будет преподавание остальных предметов на языке этой этнической группы — будут.
                                                                                          Но даже имея такую возможность, можно неплохо «поднагадить» основной этнической группе. Скажем, сделать как в Татарстане — просто не разрешать проводить ЕГЭ на татарском.
                                                                                          • –1
                                                                                            владеть обеими госязыками.
                                                                                            В России, вроде, один официальный язык. Возмжно, я не заметил, как вы ввели в тред другое государство, но тогда это отдельный вопрос.
                                                                                            Если язык основной этнической группы преподавать два часа в неделю
                                                                                            Я взял числа из вашего прошлого комента.
                                                                                            • +1
                                                                                              >> В России, вроде, один официальный язык. Возмжно, я не заметил, как вы ввели в тред другое государство, но тогда это отдельный вопрос.
                                                                                              Ну как бы вопрос малых языков не привязан только к России. Да и вроде как тарандайского языка в РФ тоже нет :-)

                                                                                              >> Я взял числа из вашего прошлого комента.
                                                                                              Извиняюсь, не совсем ясно сформулировал свою мысль в том посте.
                                                                                              • 0
                                                                                                тарандайского языка в РФ тоже нет
                                                                                                Понятия не имею, что это за язык и откуда, если честно. Но если речь о стране с двумя официальными языками, то и вопросов нет. А топик тем временем про Россию.
                                                                                              • 0
                                                                                                По крайней мере в Удмуртии и Татарстане можно обращаться вплоть до руководства региона на национальном языке, указанном как государственный в данном регион. В УР — на удмуртском, в РТ — на татарском.

                                                                                                В Швейцарии, где 4 государственных языка сложнее
                                                                                            • +1
                                                                                              Нормальное, кстати, требование. Не может же служащий знать все окрестные языки, правильно? А если надо будет эскалировать вопрос на уровень региона?

                                                                                              Государственные структуры обязаны принять заявление, написанное на, как минимум, государственном языке региона, для этого (на примере российской судебной системы) существуют внештатные переводчики, работающие на договорной основе.
                                                                                • +1
                                                                                  Кому нужны? если кому-то что-то нужно, то он за это платит.
                                                                                  Сейчас навык владения неким малым языком — это просто выброшенные из жизни часы на его изучение. Смысла не больше, чем в любом другом хобби. Кто-то детей учить самострелы делать и на полевые ролёвки отправляет, а кто-то языку, который полторы деревни знает.
                                                                                  Эльфов с зачаточным квенди может по лесам больше бегает. Тоже культура. Ну не историческая, но это мелочи.
                                                                                  • 0
                                                                                    Среди обсуждаемых есть языки, которые знают больше миллиона человек. Очень большая деревня получается.
                                                                                    Навык владения языком никогда не бывает выброшенным временем.
                                                                                    • 0
                                                                                      в системе обучения Знания -> Умения -> Навыки до навыков ещё добраться надо, сейчас во многих школах с изучением английского в лучшем случае застревают на стадии «умения». При изучении местного не родного языка школьники будут где-то примерно в начале этапа «знания». Навыки можно приобрести только в говорящей на языке семье, но это и без школы работает.
                                                                                      • 0
                                                                                        Навык владения каким языком полезнее, клингонским, синдарином или PHP?
                                                                              • +1
                                                                                Нет, это не просто язык. Это преподавание в школах, это газеты, это паблики в социальных сетях, это радио, это много чего ещё.

                                                                                Вы раз за разом упускаете самый главный фактор — заинтересованность ребёнка в освоении языка.
                                                                                Потому что вот тот же английский преподаётся во всех школах, пабликов и контента на нём пруд пруди — ни один малый язык РФ не «поддерживается» с таким рвением, как английский.
                                                                                И если «носителями английского» в результате всего этого российские дети не становятся, то «носителями тмутараканского» в результате всех тех же действий по отношению к тмутараканскому — тоже не станут.
                                                                                То, что у ребёнка в свидетельстве о рождении написано «национальность: тмутараканец», абсолютно никак не повлияет на его успехи в освоении «языка своего народа».
                                                                                • 0
                                                                                  Этот фактор я всё время держу в уме. Он прямо обусловлен другим обстоятельством, которое называется «престижность языка». Непристижный язык ребёнку учить не очень интересно. Но он же ребёнок. Если руководствоваться только тем, что ему интересно, то он всю жизнь будет в машинки играть.
                                                                                  И да, разумеется, национальность в свидетельстве ни на что не влияет.
                                                                                  • +1
                                                                                    О том и говорю, что «престиж» — самое главное, что определяет, сохранится язык или вымрет.
                                                                                    Сколько в ребёнка ни пихай неинтересный ему язык, он на нём не заговорит вне уроков. И не помогут ни газеты, ни паблики, ни армия, ни флот.
                                                                                    • 0
                                                                                      А престиж в частности, газетами, пабликами и армией создаётся. Не исключительно, но в том числе. Это не изолированные предметы.
                                                                  • 0
                                                                    >> Значит, не так уж и хотят. Примерно, как я хочу норвежский выучить.
                                                                    Нет, это означает лишь то, что у разных языков разная весовая катерогия. Это как сравнивать чувашский и русский — русский в приоритете, но если сравнить русский с английским или китайским — русским оказывается в состоянии абстрактного «чувашского» и в чистом информационно-капиталистическом пространстве не может (sic!) конкурировать на честных равноправных условиях.
                                                                    • +3
                                                                      Многие носители титульного языка этого не поймут, не попав в ситуацию «малого народа». Достаточно представить (не такую уж невозможную) ситуацию, что 80% русских оказались на грани «окитаячения». И вот оставшиеся 20% кричат им:
                                                                      — Куда вы все уходите? Вспомните Пушкина, вспомните нашу великую культуру, вспомните колыбельную, которую пела вам мать!
                                                                      А они в ответ:
                                                                      — Зачем нам ваши колыбельные и Пушкин, если чтобы продвинуться по службе и стать богатым мне и моим детям нужен китайский (английский, клингонский...). И я не хочу чтобы мой ребёнок забивал голову устаревшим барахлом.

                                                                      Я понимаю, вряд ли мои слова многих переубедят, но всё же… По крайней мере представители сотен ассимилированных народов меня поймут.
                                                                      • 0
                                                                        Я бы добавил, что все много драматичней.
                                                                        Пушкин, Достоевский и всё более-менее годное давно переведены на язык титульной нации. Дабы наследием могли пользоваться не только народы титульного языка, но и 80% «окитаяченных». Как результат — вся написанная новая литература будет распределена как 80% на титульном языке и 20% на родном (которые все одно будут потом переведены на титульный язык). И тогда возникает вопрос — а стоит ли так напрягаться? Не проще ли сразу писать на титульном языке. В результате на родном языке не создается литературы и язык хиреет окончательно…

                                                                        И если государство не занимается поддержкой языка он достаточно быстро будет ассимилирован в течении нескольких поколений.

                                                                        Но я сильно утрировал данный процесс. Часть языка малого народа может органично влиться в титульный. А может родиться новый диалект из смеси нескольких языков.
                                              • 0
                                                С возрастом это проходит.

                                                А когда начинает? Просто мне вот уже 25, не то, чтобы уже прям Возраст, но вроде голова уже на плечах есть. И с каждым днем я всё больше огорчаюсь от того, что существует множество языков и разделение по национальностям. В основе многих проблем лежат эти два ограничения.
                                                • 0
                                                  Это строго индивидуально. Но 25, пожалуй, рановато.
                                                  Семья, дети есть? Родители живы?
                                                  • +1
                                                    Не женат, детей нет и родители живы. Тем не менее мне всё больше и больше грустно из-за того, что люди разобщены из-за своих культур, и при этом еще и гордятся своей разобщенностью :) Персонально мне вообще без разницы какой язык, какая культура и какое вероисповедание у человека в голове. Пока он не начинает избивать или убивать других людей, всё это — лишь какие-то условности, которые, к слову, навязаны обществом и семьей. Я понимаю, что так работает человеческое общество, так оно остается стабильным и всё это — культура, мораль, религия — действительно нужно. Другой вопрос, зачем это всё нужно делать разными способами?

                                                    Я понимаю ваши переживания по поводу языков и культуры — вы в теме, вы способны увидеть суть трагедии и понять её. Но большая часть из нас (я в том числе) живём в неведении и счастливы. Будет ли большой трагедией, если русский язык вымрет? Наверное, будет. Просто осознать трагедию смогут единицицы из сотен :) Всем остальным будет наплевать.
                                                    • 0
                                                      Есть мнение, что с семьёй и появлением детей Ваша позиция может скорректироваться.
                                                      Разобщённость — это не абсолют, это способ видения. Я вот не делаю для себя на разобщённости акцент. Зато меня заводит культурное разнообразие, возможность интересоваться чем-то отличным от твоего, не унифицированным.
                                                      • +2
                                                        Да я понял, что мнение моё может измениться. Хотя в моих планах переехать из России в ближайшие годы, как только буду финансово готов. Поэтому дети мои, скорее всего, будут воспитываться в совсем другой культурной обстановке. В моей голове, пока что, живет мысль о том, что я не буду их заставлять хорошо знать русский. Зачем? Единственное, зачем он им понадобится — это общение со мной, потому как очевидно они будут знать локальный язык куда лучше меня и я местами просто перестану их понимать :)
                                                      • +1
                                                        В современном мире язык перестает быть средством разобщения, скайп уже научился переводить на лету, текстовые переводчики есть у всех, так что даже в китае вы не будете чувствовать себя отчужденным)

                                                        Эта проблема как раз решается, а вот потеря языкового разнообразия, без которого не может быть культурного разнообразия (язык определяет мышление), представляется весьма неприятной и нежелательной перспективой…

                                                        Скорее всего я в меньшинстве, но я каждый раз радуюсь приезжая в какую-нибудь маленькую страну со своим языком и традициями, пусть я и не знаю этого языка и это доставляет неудобства.

                                                        Разнообразие — это залог устойчивости системы, если все начнут говорить на одном языке — это примерно как если все художники начнут писать только супрематические сюжеты (условно, эсперанто) или натюрморты (условно, немцы).

                                                        Но, к сожалению, языки будут вымирать, останется несколько крупных языковых групп, возможно, среди них и найдется место русскому
                                                        • –1
                                                          Всё это правильно, кроме одного: язык не определяет мышление.
                                                          • –1
                                                            без которого не может быть культурного разнообразия
                                                            Хиппи, веганы и неофашисты прекрасно обходятся одним языком.
                                                            • 0
                                                              пожалуй, соглашусь, языковое разнообразие лишь достаточное условие для культурного многообразия, но вовсе не необходимое.
                                                            • +1
                                                              язык определяет мышление

                                                              Мышление определяет социальная группа, в которой воспитывается человек, а также доступные ему материалы для изучения. Некоторые племена не умеют считать дальше двух. У них все просто: один, два, много. Но это не потому, что у них в языке нет слов для обозначения остальных чисел, а потому что оказалось невостребованной сама идея того, что что-то больше двух нужно считать как-то отдельно.
                                                              • 0
                                                                Вы не видите противоречия в своих словах? Подскажу

                                                                0) Вы утверждаете, что в рамках одного языка культура перестает развиваться.
                                                                1) Вы приезжаете в маленькую страну с богатой культурой
                                                                2) В этой стране все говорят на одном языке

                                                                Вам не кажется, что где-то здесь появились взаимоисключающие параграфы? Я уж не говорю о том, что до эпохи глобализации, люди, говорящие на разных языках встречались сравнительно редко, а культура всё равно развивалась.
                                                                • +1
                                                                  нет, противоречия нет, так как пункт 0) я не утверждал. Я говорил об отсутствии культурного многообразия. Те же дарвиновские процессы применительно к социо-культурным процессам. Один единственный агент, маленькая (но гордая=) этническая группа, порождает какой-то культурный продукт, культура развивается, но условно в одном направлении.

                                                                  Наверное, я упростил, скорее так, культурное многообразие порождается полицентричностью, которая естественным образом возникает, неважно как причина или следствие, при языковом разнообразии. Но полицентричность вполне может быть и в рамках одного языка, правда единственный пример который я вижу — англосаксонский мир, да и то тут можно вставить несколько «но».

                                                                  Я уж не говорю о том, что до эпохи глобализации, люди, говорящие на разных языках встречались сравнительно редко, а культура всё равно развивалась.


                                                                  Мне кажется, это распространенное заблуждение, что до 20 века люди не общались и не перемещались по миру, а еще была почта, которой активно пользовались =).

                                                                  Если мне не изменяет память, то многие «мыслители» как раз активно путешествовали и меняли своих «работодателей» — королей/герцогов/принцев, например, Лейбниц, Эйлер, Гюйгенс.
                                                            • +2
                                                              Моему отцу 65. Есть внуки, живы родители. И он счастливый человек в том плане, что в детстве его отдали в языковую школу и поставили ему отличный английский. Он не ИТшник даже близко, и с компьютером не так чтобы на «ты», но что в нём, что в телефоне, что в интерфейсе автокомпьютера — везде английский интерфейс. Фильмы он чаще смотрит в оригинале, а если не англоязычные — то переведённые на английский, а не русский. Русскоязычные — на русском. Частенько, пробегаясь по новостным каналам за завтраком, останавливается на англоязычных. Человек просто не привязывает язык к ареалу обитания, месту рождения, истории рода, культуре нации, генам. Живёт себе в родной Москве, ездит по миру, пользуется удобным языком. Исчезни русский — он и не дёрнется.
                                                              Мне 32, ситуация аналогичная, за исключением того, что ради фана в школе добавил к английскому базовый французский. Ну, так, чтоб если в Швейцарии буду — выпендриться. Лет в 20, когда шарился по немецким форумам в поисках некоторых мотозапчастей, разобрался в немецком, от чего очень плевался и проклинал многоязычие мира.
                                                              А у его родителей позиция ровно как у вас. Даже нечего добавить.
                                                              Это я к чему: у вас (как и у родителей моего отца) какое-то прямо религиозное поклонение идеям антиглобализации, если можно так сказать. Кто-то говорит, что с возрастом приходят к богу, а вы — с возрастом проходит желание быть Гражданином Мира. Да вот не проходит. Не проходит у тех, кто был воспитан в духе «я человек с планеты Земля». Такие люди легко меняют место проживания, их раздражают разговоры про скрепы, всякие холодные войны, и радуют достижения учёных и космонавтов, инновации транснациональных корпораций и мелких стартапов. И уж тем более им глубоко пофигу на сохранность каких-нибудь там древних техник вязки узлов для привязывания оленя к юрте такого-то вымирающего народа крайнего севера. В вас воспитаны одни ценности, в нас — другие. Это навсегда.
                                                      • +1
                                                        Но речь не о том, чтобы выучить новый язык. Речь о том, чтобы не забыть свой родной. Если его не преподают в школе, если на нём не издают газет, Вы будете считать его не престижным. И у Вас не будет времени и мотивации на нём общаться. Постепенно будете забывать. А потом через 20 лет совсем забудете. Но при этом вдруг проснётся жажда самоопределения, попытка понять, «кто я?» и «где я?», потянет к истокам, к своим родным, к своей культуре. А язык-то забыт, и будет мучительно больно, что 20 лет назад не занимался этим языком, хотя бы даже из-под палки.

                                                        Мир устроен намного сложнее. Есть масса примеров, когда некая социальная группа воспринимает свой родной язык не как культурное достояние, а как стигму, от которой хотелось бы избавить потомков. Один из таких примеров даже упомянут в посте: идиш, который практически полностью вымер в СССР (и в Старом Свете вообще), потому что носители не хотели учить ему молодёжь.
                                                        • 0
                                                          >> Один из таких примеров даже упомянут в посте: идиш, который практически полностью вымер в СССР (и в Старом Свете вообще), потому что носители не хотели учить ему молодёжь.
                                                          Вопрос с идишем не так прост: огромное (если не практически всё) население говорящих на идиш проживали на территории БССР до ВМВ. Их так было так много, что в Конституции БССР 27 г. идиш был одним из четырёх госязыков, наряду з белорусским, русским и польским. Это, кстати, единственный случай за всю историю, когда он был госязыком. А потом пошла в 30-х волна русификации в ответ на предыдущую белорусизацию (точнее, наверное, нациолизацию — на идише выходили законы, словари и пр., не считая бытовых моментов — газет и книг), а потом в 40-х — Вторая Мировая и Великая Отечественная, которые ни разу не были милыми к евреям…
                                                          • 0
                                                            >> Вопрос с идишем не так прост: огромное (если не практически всё) население говорящих на идиш проживали на территории БССР до ВМВ.

                                                            Они проживали на всей территории БССР, а также в западных и южных областях УССР — за дореволюционной «чертой оседлости».

                                                            >> а потом в 40-х — Вторая Мировая и Великая Отечественная, которые ни разу не были милыми к евреям…

                                                            Из вики: «После нападения Германии часть евреев (до 1,5 млн человек) были эвакуированы. На оккупированных территориях оказались до 3 млн человек, большинство из которых погибли.»

                                                            Т.е. примерно треть всех советских евреев остались в живых, но были перевезены в области, где евреи были чужаками, и довоенное население относилось к ним соответственно. (В числе этих «понаехавших» из УССР — мои дедушка с бабушкой.) Легко понять, почему в этих условиях носители идиша старались им не пользоваться.
                                                            • 0

                                                              Однако же, многие, в том числе мои дедушка и бабушка, после окончания войны вернулись в родные места.

                                                              • 0
                                                                И там научили следующее поколение идишу?!
                                                          • 0
                                                            Его не учат потому что есть иврит.
                                                            • 0
                                                              Иврит есть давно, но учить идиш перестали только в XX веке. Значит, дело не в иврите.
                                                              • 0
                                                                Но до XX века иврит был мёртвым языком.
                                                                • 0
                                                                  До XX века иврит не был бытовым языком, но письменный контент (религиозные труды, брачные контракты и т.п.) на нём создавался всегда.
                                                                  • 0
                                                                    Что прямо подпадает под определение мёртвого языка.
                                                                    Если уж быть совсем точным, то эта история, что иврит сначала умер, а потом был возрождён, заставила лингвистов придумать специальный термин — «спящий» язык.
                                                                    Письменный контент и сейчас на латыни создаётся. Живым языком это её не делает.
                                                                    • 0
                                                                      Как тогда обозначают разницу между языками вроде шумерского, интересными лишь лингвистам и историкам, и языками вроде латыни, широко используемыми в небытовых целях?
                                                                      • 0
                                                                        В лингвистике — никак. Это одинаково мёртвые языки.
                                                                        Бывают ещё разные с точки зрения религии разные языки: те, на которых созданы священные тексты и остальные. И там не важно, мёртвые они или нет.
                                                                        • 0
                                                                          В англоязычной лингвистике их таки различают:
                                                                          An extinct language is a language that no longer has any speakers, especially if it has no living descendants. In contrast, a dead language is «one that is no longer the native language of any community», even if it is still in use, like Latin.
                                                            • 0
                                                              В Израиле, в США и некоторых других странах проживает достаточное количество религиозных евреев, у которых идиш — родной язык.
                                                              В Израиле они знают идиш и иврит, в Америке — идиш и английский, и т.д.
                                                              Они говорят на своем языке в семьях, есть садики, учебные заведения, и кружки для детей, пресса.
                                                              Я думаю, что в интернете идиш представлен непропорционально мало, потому что многие религиозные евреи принципиально не пользуются интернетом.
                                                              Короче, за идиш не волнуйтесь. Он вымер только в СССР.
                                                              • 0
                                                                Он вымер только в СССР.

                                                                И в Европе в целом.
                                                                • 0
                                                                  Ну нет же.
                                                                  Большие и маленькие хасидские общины есть во многих странах Европы. Их может быть несколько тысяч или несколько десятков семей в одном городе. Казалось бы, путь к вымиранию. Но! Они обычно женятся не выходя из своего хасидута (то есть хасид Лелов на хасидке Лелов, а хасид Бобов на аналогичной хасидке), оба родителя говорят на идиш, особенно если они из разных стран, и десяток детишек у них не редкость. То есть идиша в Европе мало, но он растет.
                                                                  Я понятно объясняю динамику процесса?
                                                          • 0
                                                            А теперь захотите говорить на латыни ну или, чёрт с ним, эсперанто. Сколько вы себе собеседников найдёте или книжек прочитаете, фильмов и спектаклей посмотрите? Ладно, пусть «чукча не читатель, чукча писатель» — напишите вы отличный рассказ и кто будет его читать?
                                                            • 0
                                                              Да, это ужасно. Не хотите первым скинуться в мой фонд развития эсперанто?

                                                              Фактически, вы вкратце пересказали ветку моих комментариев. Да, малый язык вымирает потому, что на нем нет ни контента ни потребителей. Но нет, с этим ничего не сделать.
                                                              • 0
                                                                Только почему-то никак не понимаете, что это и есть то самое давление по отношению к носителям менее популярных языков — «говори с нами по-нашему, а на свой тарабарщине лучше молчи в тряпочку». Вы, думаю, тоже быстренько забьёте на английский если вокруг будут одни китайцы и даже клавиатура несовместимая с латиницей.
                                                                • –1
                                                                  Так вы хотите скинуться или нет?
                                                          • +1

                                                            Кстати есть еще один момент… Без давления язык прекращает развитие, и начинает отмирать. Сужу по ростовским армянам.
                                                            Они на данный момент не могут общаться на чистом армянском языке без русских слов, просто не хватает армянских(ростово-армянских :)) слов, при этом недостающие слова есть в армянском языке (армяно-армянском :)). То есть язык поддерживается благодаря традициям, без давления и в нем не возникает новых слов, и он "усыхает".
                                                            Но конечно они с этим борются, благо есть откуда брать "новую кровь", поэтому частенько отправляют детей пожить в ту языковую среду к дальним родственникам (нужно же поддерживать родственные связи даже спустя 200 лет)), в семьи вводят и сюда перетягивают молодежь и язык все же живет.


                                                            И еще один пример, кроме армянской общины у нас есть довольно большая корейская община, но даже с учетом, того что корейцы к нам перебрались намного позже чем армяне, они практически все одноязычные, родной только русский язык, корейским владеют в основном старики.

                                                        • 0
                                                          Вообще-то если жив хотя бы один носитель… то язык не мёртв.
                                                          Вообще-то это не так. На латыни говорят (или могут говорить) тысячи человек, но язык этот — мертвый. Критерии «мертвости» языка довольно расплывчатые, но с количеством его носителей связаны мало.

                                                          • 0
                                                            Вы путаете понятия. Носители — это не то, кто говорит. Это те, кто с рождения языком владеет. Не расплывчатые это понятия, всё просто: если язык не передаётся в семье (=нет носителей), то язык мёртв.
                                                            • 0
                                                              Что-то вы сами напутали: носитель — любой человек, который владеет языком, независимо от того, когда он им овладел.
                                                              А что такое мёртвый язык почитайте официальные определения данного термина. И не выдумывайте.
                                                              • 0
                                                                Кажется, что не выдумывать лучше Вам. Носитель — это native speaker, тот, кто владеет языком с детского возраста.
                                                                Что такое мёртвый язык, хорошо известно. Тут особенного простора для фантазии нет.
                                                                • +1
                                                                  >> Носитель — это native speaker, тот, кто владеет языком с детского возраста.
                                                                  Вы всё-таки путаете два понятия в одно:
                                                                  native speaker — носитель языка как родного
                                                                  language speaker — носитель языка
                                                                  Усвоение языка в детстве является дополнительной чертой носителя, а не обязательной. Во всяком случае, разные лингвисты относятся к обязательности этой характеристики по-разному. Например, одно из определений носителя языка это " Индивид, владеющий данным языком, как родным."
                                                                  • 0
                                                                    Ну вот я и отношусь к обязательности этой характеристики строго. Потому что если мы что-то хотим про язык узнать, то спрашивать не у носителя, который native speaker — только время терять.
                                                                    • 0
                                                                      Далеко не факт. Показательные примеры — ребёнок, переехавший на постоянное проживание в другую этногруппу или зрелый/пожилой человек, проживший 2/3 своей жизни в такой группе.
                                                                      • 0
                                                                        Ну а что «факт» или не «факт». Ответственный лингвист не будет анкетировать человека, прожившего 2/3 своей жизни в такой группе.
                                                                        • +1
                                                                          Это смотря что является объектом его исследований )
                                                                          • 0
                                                                            А кому это еще важно кроме лингвистов?
                                                                            • 0
                                                                              Не знаю, что Вы имеете в виду под «важностью» в данном случае. А лингвисты здесь — представители науки, которые оценивают чистоту получаемых знаний. Если что-то, имеющее отношение к языку, признаётся важным в их измерительной системе, значит, это стоит учитывать.