
Текст: Елена Кухтенкова/РГ
Он отметил, что в последнее время академическая деятельность часто приводит его к разговорам о современных технологиях, связанных с большими языковыми моделями.
— Конференции, рецензии на статьи, обсуждения в чатах и на форумах — все это не только отличный источник знаний, но и живые примеры того, как язык адаптируется к новым реалиям, — рассказывает Шульгинов. — Как говорят англичане, "раскрыть рот — значит себя разоблачить". Мне кажется, что выбираемые слова представляют собой своего рода одежду: как халат врача или бутсы футболиста.
Итак, лингвист поделился разными названиями искусственного интеллекта, которые показывают, кем является говорящий.
ИИ/АИ — удобный зонтичный (объемный) термин для обозначения всего спектра технологий, связанный с технологией нейронных сетей.
К сожалению, объяснил Шульгинов, этот "зонтик" имеет слишком широкие поля и скрывает незнание академических тонкостей.
— Я обычно встречаю этот термин в заявках на гранты или докладах на междисциплинарных конференциях, где он используется неспециалистами в качестве магического заклинания, — пояснил он.
В неформальном общении с коллегами так говорить вполне уместно, но в серьезной научной статье он вызывает вопросы и сомнения.
По мнению Валерия Шульгинова, здесь чаще всего идет речь о поверхностном уровне знакомства говорящего с технологией.
LLM/ЛЛМ — самый нейтральный и точный термин для больших языковых моделей (тип программы искусственного интеллекта, которая может распознавать и генерировать текст).
— Я встречаю его в серьезных научных статьях от разработчиков и исследователей, которые действительно работают с этими технологиями, — сообщает лингвист и добавляет, что в живом разговоре с коллегами из области машинного обучения часто слышит уменьшительные версии — вроде "ллмка" или "моделька". Добавление таких суффиксов, по его словам, как будто преуменьшает серьезность технологии и показывает иронию или даже снисходительность.
Это уровень знакомства с нейросетью — профессионалы, разработчики, исследователи в области машинного обучения и обработки естественного языка.
БЯМ — пример прямого калькирования англоязычного LLM (Большая Языковая Модель). Обычно используется в русскоязычных научных статьях и является следствием попытки русифицировать термин.
— Начинание хорошее, но БЯМы, постоянно мелькающие в научных статьях (в речи их предпочитают избегать), в какой-то момент начинают сильно раздражать, — признается Валерий Шульгинов. — Важно помнить: форма слова не менее важна, чем его содержание.
Это уровень знакомства с технологией — стихийный лингвист из мира технологий.
AGI (Artificial General Intelligence) — термин, любимый техническими специалистами, которые очень хотят выиграть грант, говорит Шульгинов, поэтому обещают разработать нечто, что пока не может существовать. Он часто встречается в блогах тех, кто хочет привлечь много читателей.
Уровень знакомства с технологией — знаток.
Гопотэ/Жэпэтэ (искаженное GPT) — это название, по мнению Валерия, используется блогерами, которые рассказывают о технологиях с иронией.
— Такое сознательное искажение названия — попытка поиграть со словом, но получается довольно неудачно и иногда вызывает улыбку скорее из-за странности самого пишущего, чем из-за тонкости юмора, — считает Шульгинов и называет этот знакомства с технологией — шарлатан.
И наконец, AMI (Advanced Machine Intelligence) — термин, придуманный спецами по машинному обучению, например, информатиком Яном Лекуном. — Он уже выиграл все возможные гранты и теперь может задумываться о более широких и нейтральных названиях для "умных" машин — без излишней антропоморфности и с уважением к разным точкам зрения, — поясняет лингвист.
Уровень знакомства с технологией: нейрогуру.
Валерий Шульгинов убежден, что со временем язык в этой области застынет в упорядоченном виде, как это уже случилось с терминологией в смежных областях науки и техники. Появятся общие для всех термины, четкие границы и понимание на всех уровнях — от новичков до экспертов.
— А пока мне кажется важным помнить, что язык — это не просто набор слов, а отражение нашего мышления и отношения к технологиям, которые мы создаем и используем", — подчеркнул он.