Category: лингвистика

Category was added automatically. Read all entries about "лингвистика".

Flammable

Yañı qazah elifbesi. Üçünci versiyasi.

Последняя, от 28 января 2021 г. версия нового казахского алфавита.



В первой версии 2017 г. вместо диакритики использовались послебуквенные апострофы - как в узбекской и каракалпакской латиннице - G`. O`, ..., C`, S`.
И как "ъ" в крымскотатарской килиллице в Къ и Нъ ("Yañı qazah" из заголовка поста в кириллическом написании - "Янъы къазах").
Что IMHO не лучший вариант.

Во второй версии, от 19 февраля 2018г., апострофы заменили на грависы - Ǵ, Ó.
Но там вдруг появились диграфы - Ch вместо C` и Sh вместо S`.
Что есть страшная ересь отступление от принципа правильного тюркского алфавитостроения "один звук - одна буква".

В третьей версии грависы заменили на привычную по турецкому, крымскотатарскому, азербайджанскому и туркменскому диакритику - Ğ, Ö, ... Ş.
Выбросив C`/Ch предыдущих версий (нет звуков [ч] и [дж] в казахском). Но оставив С - вместе с X и W - для иноязычных слов.

Но вот использовать "ı" для [и], а не [ы] и "y" для [ы], а не [y] (как в турецкой-крымскотатарской-азербайджанской латинницах) - это IMHO не комильфо.
Туркменщина какая-то - у них тоже "y" для [ы]...
Flammable

Терминологическое: безопасность vs безопасность

Точнее, safety vs security.
И причиняемые ими страдания в терминологической группе. Поскольку ваяется глоссарий, который далее должен обофициалиться.

Семантика safety и security различна - но в русском в общей лексике они обзываются одним словом - "безопасность".
То же самое - в терминологии / в стандартах.

В украинском аналогично - одно на двоих "безпека". И это отстойно и недопустимо.

В общем, эта штука не менее задумчива, чем терминологическое определение effectiveness vs efficiencyCollapse )

P.S. А вот как в русском дистинктировать safety vs security - пока понятия не имею.
P.P.S. А как еще достает общелексическая омонимия, когда нужна терминология... Разработчикам OASIS Service Oriented Architecture RA пришлось раздвоить organization. Там, где речь идет об организации данных и сервисов, они оставили organization. А организации, которые из людей, они заменили на social structures...
Flammable

Лингвистические базы: Glottolog

Недавно обнаружил сайт Glottolog - референсную / библиографическую базу по языкам.
Если не всем, то очень многим.

Очень приятный ресурс - в т.ч. с раскрывающимися деревьями языковых семей и библиографией по уздам.

Пример - крымскотатарский в дереве тюркских языков.

P.S. Academia.edu в последнее время троллит: уже третье за последнее время письмо с извещением "The name "V. Kurg" is mentioned in a Turkology paper" и намекает на платную Premium подписку, обещая рассказать, кто и в чем поминал...
Flammable

О жути русского языка.

Представьте себе впечатление, которое грамматика ру-языка производит на носителя какого-либо языка более приличного, например, крымскотатарского*.

1. У них есть грамматический род. Даже для _неодушевленных_ существительных.
Куски железа они наделяют полом: гайка у них, оказывается, женского пола, а болт - мужского.
Неудивительно, что у этих извращенцев процесс сборки машин и механизмов превращается в порнографию.
Чему наглядной иллюстрацией - результат сего действа: взять, к примеру, хотя бы Ладу Самару**
Более того, эту озабоченность они распространили и на прилагательные, и глаголы, и местоимения - со всеми вытекающими.

2. У них нет настоящего времени глаголов совершенного вида. В настоящем вpемени они могут лишь ДЕЛАТЬ что-то (несовеpшенный вид). СДЕЛАТЬ (совеpшенный) что-либо в настоящем времени невозможно - но почему-то можно сделать нечто в пpошедшем и в будущем вpеменах.
Может, именно поэтому они так превозносят свое славное великое прошлое и грядущее величие будущего - поскольку в настоящем что-либо свершить грамматически не дано***.

3. У их глаголов нет прошедшего категорического времени!
То есть выразить мысль, что нечто ДЕЙСТВИТЕЛЬНО произошло / было сделано / просто было в прошлом простой фразой они не могут. Что в сочетании с предыдущими пунктами дает поистине чудовищный эффект.
То есть носитель русского языка, говоря о прошлом, говворит не о том, что было, а о том, что "типа было". И да, определенных/неопределенных артиклей, которые хоть как-то могли бы прояснить ситуацию, у них нет****
Откуда, вероятно, и непредсказуемость их истории и всяческие Комиссии по противодействию искажению славного прошлого.

...и ведь это далеко не полный список...

* Вспоминаем гипотезу Сепира-Уорфа о отм, что структура языка влияет на мировосприятие и воззрения его носителей, а также на их когнитивные процессы.
** Вероятная этимология эпитета "Самара" - слияние библейского "Содом и Гоморра", описывающего процесс и результаты производства.
*** Евгений Лукин. Манифест партии национал-лингвистов. http://books.rusf.ru/unzip/add-on/xussr_l/lukine20.htm?1/1
**** Евгений Лукин. Типа неопределенный артикль. http://www.rusf.ru/lukin/books/tipa_artikl.htm
Flammable

Прикладная лингвистика в NATO StratCom

Интересная работа по кодификации терминологии - Improving NATO Strategic Communications Terminology.
Лексика каковых коммуникаций должна, с одной стороны, быть однозначно/моносемно терминологизирована в самом StratCom и среди стран-членов с их вавилонским набором языков.
С другой стороны, эта лексика должна быть понятна другим субъектам коммуникаций (они же, заодно, объекты PsyOps/InfoOps).
И, главное, корректно понимаема ими нативно - без чтения StratCom-тезаурусов.

Collapse )
Flammable

Крымское интернациональное зимнее солнцестояние

Название праздника "Йыл геджеси" буквально - "ночь года".
Имя празднества "Календа" - пришелец из латыни через итальянский. Название дня праздника "Кантар", весы, - из греческого κεντηνάριον.
Ну а праздничные "алюшке" / "галушки" - no comment ;)
Из той же серии, что и "тютюн"/"тютюн", "вишне"/"вишня", "къаве"/"кава", "фильджан"/"філіжанка" и т.д. и т.п. :)
Flammable

Пить, курить и выражаться: статподтверждение Facebook'ом :)

Tao Ding et al. Social Media-based Substance Use Prediction. arXiv:1705.05633v2
Опубликовано в разделе Computer Science > Computation and Language

Вообще-то с растущим объемом машинносчитываемого нарратива в соцсетях работы по корпусной лингвистике с социолингвоуклоном стали гораздо менее трудоемкими и посему привлекательны.
А чтобы не заморачиваться со скучной самостоятельной обработкой данных и их же анализом возникает желание спихнуть это дело на противоестественный искуственный интеллект. В лице machine learning.
Что, во-первых, модно, и, во вторых, позволяет не напрягаться еще более снижает трудоемкость.

Естественно, возникает искушение наложить это дело на какую-нибудь эпидемиологию - что и было сделано в данной публикации.

Итак, как это было сделано и что получилось.
Collapse )
Flammable

Корпус крымскотатарского языка

Къырымтатар тилининъ лингвистик корпусы - совместное детище Симферопольского унаверситета и Института языкознания Словацкой академии наук
Поиск доступен здесь:
http://korpus.juls.savba.sk/QIRIM/

Тескты кириллические.

И об агглютинативности крымскотатарского и о правильных - в смысле компьютерной лингвистики :) - типах языков, цитата:
Для корпуса важно существование морфологического анализатора и лемматизатора, который позволяет ... /ну много нужного и приятного/
На самом деле, агглютинативный характер крымскотатарского языка позволяет заместить отсутствие поиска по леммам использованием регулярных выражений. Так например для того чтобы найти все формы слова бала (ребенок), надо ввести регулярное выражение бала.*, где . заменяет любой символ, и * соответствует нулю или более копий предыдущего (любого) символа, в результате чего такой запрос вернёт все формы (т. е. падежи) слова бала.
(Garabík Radovan, Кубединова Ленара Шакировна. Корпус текстов крымскотатарского языка. In: Tруды международной конференции MegaLing'2006 – Горизонты прикладной лингвистики и лингвистических технологий. Партенит, Ukraine)



И конкретно о логичности и удобстве правильных агглютинативных языков.
Пара примеров из корпуса (из Гарабека-Кубетдиновой) с некоторыми моими пояснениями:

радиоэшиттирювлеримизнинъ – "наших радиопередач", где
радио – корень,
эшит-  - корень (инфинитив "эшиттирмек" - eşittirmek),
юв-  - аффикс отглагольного словообразования имён существительных
-лер - аффикс множественного числа,
-имиз - аффикс принадлежности настоящего времени 1 лица множественного числа,
-нинъ - аффикс родительного падежа.

укъукъкъорчалайыджыларгъа – "правозащитникам", где
укъукъ – корень ("право")
къорчалай- – корень ("защитник" - но не в юридическом смысле - адвокат - а в чисто физическом: отглагольно от защищать - qorçalamaq)
-ыджы- - аффикс отглагольного словообразования имён существительных,
-лар- аффикс множественного числа,
-гъа – аффикс дательно-направительного падежа.

P.S. Крымскотатарский онлайн словарь // Alem-i Medeniye. Латинница. Здесь же можно скачать файл для Lingvo.
Flammable

Этимологический словарь славянских языков: Вып. 1-35