ГИЗАУРУС базовых понятий искусственного интеллекта. (Для пользователей и пол (ь) зователей). Том 1 (проспект)
ГИЗАУРУС базовых понятий искусственного интеллекта. (Для пользователей и пол (ь) зователей). Том 1 (проспект)

Полная версия

ГИЗАУРУС базовых понятий искусственного интеллекта. (Для пользователей и пол (ь) зователей). Том 1 (проспект)

Настройки чтения
Размер шрифта
Высота строк
Поля
На страницу:
2 из 13

Связи: ИИ (базовое), Большие данные (объект).

«Но ни с одним из таких роботов невозможно установить эмоциональную связь. И тем не менее, ожидается, что в ближайшие несколько лет социальные роботы должны заметно усложниться. Мы подходим к поворотному моменту: сегодня роботы обладают более обширными интерактивными возможностями и выполняют больше полезных задач, чем когда-либо прежде. Благодаря достижениям в области искусственного интеллекта появилась возможность переводить в алгоритмы психологические и нейронаучные наблюдения. Это позволяет роботам распознавать голоса, лица и эмоции; интерпретировать речь и жесты; адекватно реагировать на сложные вербальные и невербальные сигналы; устанавливать зрительный контакт; вести непринужденную беседу; адаптироваться к потребностям людей, усваивая уроки из обратной связи, поощрений и критики. Социальные роботы начинают играть все более разнообразные роли. Так, ростом 1,2 метра человекоподобный робот по имени Пеппер (от SoftBank Robotics) распознает лица и основные человеческие эмоции и участвует в разговорах через сенсорный экран, расположенный у него в „груди“.» [Будущее: роботы рядом с нами // «Знание ― сила», 2020]

БОЛЬШИЕ ДАННЫЕ / Big Data

Уровень 1 (Суть): это «цифровой океан» информации – столько данных, что их невозможно обработать обычными способами.

Уровень 2 (Как работает): использование мощных серверов для поиска скрытых связей в хаотичных потоках текстов, видео и транзакций.

Уровень 3 (Почему важно): это «топливо» для ИИ; без огромных датасетов современные нейросети не смогли бы ничему научиться.

Связи: Машинное обучение (метод обработки), Приватность (риск).

«По ссылке можно посмотреть прекрасное введение в проблематику алгоритмизации и рассказ о сложности ответа на вопрос „Что такое алгоритм?“. Большие данные (Big Data) Объемные, быстро растущие в количестве и многообразные по структуре и типам информации данные». [Алексей Незнанов. Тезаурус: История больших данных. Базовые понятия, чтобы разобраться в связи между анализом больших данных и разработкой искусственного интеллекта (2018.06) // «Постнаука», 2018]

ГЕНЕРАЛЬНЫЙ СЛОВНИК РЯ / General Vocabulary of Russian

Уровень 1 (Суть): единый «реестр» всех слов русского языка, когда-либо зафиксированных учеными.

Уровень 2 (Как работает): сводный список, объединяющий словники академических, диалектных и специальных словарей.

Уровень 3 (Почему важно): ключ к созданию универсальных систем распознавания речи и полнотекстового поиска.

Связи: АСК РЯ (реализация), НКРЯ (соседняя база). (Генеральный словник русского языка Титул // Говор: альманах. 2013. №11—1. С.1—2. – EDN SMPIBJ).

ГЕНЕРАТИВНЫЙ ИИ / Generative AI

Уровень 1 (Суть): ИИ-творец, который не просто анализирует старое, а создает принципиально новое: тексты, стихи, картины, музыку и код.

Уровень 2 (Как работает): модели (типа GPT или Diffusion) предсказывают, какой фрагмент контента лучше всего дополнит предыдущий на основе выученных стилей.

Уровень 3 (Почему важно): совершает революцию в креативном труде, вызывая споры об авторстве и истинности контента.

Связи: ChatGPT (сервис), Трансформер (архитектура).

«Генеративный искусственный интеллект (Generative Artificial Intelligence, или GenAI) – это тип нейронных сетей, которые используются для создания новых данных на основе полученной при обучении информации. Такие нейросети могут создавать изображения, тексты, аудио и видео, концепты и другие типы контента. Суть генеративного искусственного интеллекта заключается в развитии машинного обучения. Нейросеть учится на загружаемом в неё массиве данных, из которых она способна извлечь некие характеристики и закономерности. На основе этого собирательного анализа нейросеть генерирует новый контент. Например, когда мы пишем текстовый промпт в Midjourney, нейросеть создаёт ответ именно на основе ранее изученного материала». (https://practicum.yandex.ru/blog/generativnyi-iskusstvennyi-intellekt/)

ГИБРИДНЫЙ ИНТЕЛЛЕКТ / Hybrid Intelligence

Уровень 1 (Суть): кентавр будущего – союз человеческой интуиции и творческого начала с мощью машинных вычислений.

Уровень 2 (Как работает): система, в которой ИИ берет на себя рутину и анализ, а человек принимает финальные этические и стратегические решения.

Уровень 3 (Почему важно): позволяет достичь результатов, недоступных человеку или машине по отдельности.

Связи: Симбиоз (метафора), Коллаборация (форма).

«Гибридный интеллект объединяет искусственный и человеческий интеллект для достижения более эффективных результатов. Он сочетает в себе преимущества обоих типов интеллекта, позволяя решать сложные задачи и принимать взвешенные решения. Гибридный интеллект- это система адаптивного информационного взаимодействия коллектива операторов и информационной техники, построенная по следующим принципам: 1. динамичность взаимодействия системы; 2. наличие развитых средств сбора, хранения, передачи и обработки информации; 3. наличие наряду с узкопрофессиональными языками общего универсального языка общения». (https://dzen.ru/a/Zr8WKz8splrkWDOE)

ИНКЛЮЗИВНОСТЬ / Inclusivity

Уровень 1 (Суть): это «открытые двери» в мир технологий для всех, независимо от возраста, образования или физических возможностей.

Уровень 2 (Как работает): проектирование систем (и словарей) так, чтобы язык был простым, интерфейс удобным, а доступ – свободным.

Уровень 3 (Почему важно): предотвращает появление «цифровых изгоев» и обеспечивает равные шансы на успех в эпоху ИИ.

Связи: Пол (ь) зователь (объект), Метаязык (инструмент).

«Глава римско-католической церкви отметил, что искусственный интеллект и роботы в силах изменить мир к лучшему, но только в том случае, если технологии будут использоваться правильно. Иначе плоды технического прогресса приведут к усилению неравенства и, возможно, глобальным вызовам для всего человечества. Ранее в 2020 году Ватикан совместно с Microsoft и IBM опубликовал „Римский призыв к этике искусственного интеллекта“. В нем обозначены принципы, которыми должны руководствоваться разработчики технологии: прозрачность, инклюзивность, ответственность, беспристрастность, надежность и безопасность». [Папа Римский призвал молиться о безопасности роботов // РИА Новости, 11.11.2020]

ИНСТРУМЕНТАРИЙ ПЕРВОГО КАСАНИЯ / Tool of First Contact

Уровень 1 (Суть): «песочница» для новичка – набор самых простых и безопасных сервисов, на которых можно впервые попробовать ИИ в деле.

Уровень 2 (Как работает): Связка термина ГИЗАУРУСа с конкретной ссылкой (напр., Kandinsky для рисования), позволяющая проверить теорию на практике за 1 минуту.

Уровень 3 (Почему важно): Снимает страх перед неизвестным и дает мгновенное ощущение успеха («Я могу управлять ИИ!»).

Связи: ГИЗАУРУС (база), Апробация (метод).

КОМПЬЮТЕРНОЕ ЗРЕНИЕ / Computer Vision

Уровень 1 (Суть): это «глаза» машины – способность ИИ видеть, опознавать предметы и ориентироваться в пространстве.

Уровень 2 (Как работает): изображение разбирается на пиксели, в которых нейросеть ищет характерные линии, формы и текстуры.

Уровень 3 (Почему важно): основа для беспилотных авто, медицинской диагностики по снимкам и систем безопасности.

Связи: Нейронная сеть (инструмент), Автономные системы (применение).

«В том числе это компьютерное зрение, когда машина с помощью камеры может видеть и распознавать изображения, рекомендательные системы, когда машина помогает сделать выбор, изучая предпочтения людей, и интеллектуальные системы поддержки принятия управленческих решений». [Сгенерированный голос почти невозможно отличить от человеческого, сказал Греф // Парламентская газета, 2021.01.27]

КОРПУС ТЕКСТОВ / Text Corpus

Уровень 1 (Суть): «сырье» для лингвиста и нейросети – систематизированное собрание текстов, представляющее язык в его многообразии.

Уровень 2 (Как работает): тексты оцифровываются, очищаются от мусора и размечаются тегами (части речи, значения), превращаясь в датасет.

Уровень 3 (Почему важно): качество ИИ напрямую зависит от качества корпуса, на котором он учился «думать».

Связи: Большие данные (форма), Разметка (процесс).

«Первый корпус текстов брался из личных запасов (библиотек) организаторов». [Андреева Ю. И. Многоточие сборки (2009)]

«Полностью буддийская литература, синтезировавшая и многие черты книжной индийской словесности (стихи украшенного стиля маха-навья), до нас не дошла, но ее удается восстановить, сопоставляя периферийные ответвления (цейлонский корпус текстов на пали и восточно-азиатские переводы с центрально-азиатскими промежуточными звеньями центрально-азиатские тохарские и иранские переводы и т. п.)». [Иванов Вяч. Вс. Литературы Древнего Востока: Краткий конспект лекций (1988)]

МАШИННОЕ ОБУЧЕНИЕ / Machine Learning (ML)

Уровень 1 (Суть): это «учеба на примерах» – способ научить компьютер решать задачу, не прописывая каждое правило вручную, а показывая ему тысячи образцов.

Уровень 2 (Как работает): математическая модель настраивает свои внутренние параметры (веса), чтобы минимизировать ошибки в предсказаниях на основе опыта.

Уровень 3 (Почему важно): основа современного прогресса ИИ; позволяет автоматизировать процессы, которые раньше считались не поддающимися автоматизации.

Связи: ИИ (более общее), Нейронная сеть (частное).

«Слабый искусственный интеллект (Weak AI или Narrow AI) на это не способен, но позволяет решать задачи, которые традиционно считались творческими. Большинство сегодняшних разработок относятся к слабому ИИ. С его помощью мы пытаемся автоматизировать некоторые процессы принятия решения, задачи распознавания и генерации образов. В частности, традиционно к слабому ИИ относят классическое машинное обучение. Тест Тьюринга Тест, предложенный Аланом Тьюрингом в 1950 году. Цель теста – определить, может ли машина мыслить неотличимо от человека». [Незнанов Алексей. Тезаурус: История больших данных. Базовые понятия, чтобы разобраться в связи между анализом больших данных и разработкой искусственного интеллекта (2018.06) // «Постнаука», 2018]

НЕЙРОННАЯ СЕТЬ / Neural Network

Уровень 1 (Суть): математическая имитация «коллективного разума» нейронов мозга, где множество простых элементов вместе решают сложную задачу.

Уровень 2 (Как работает): состоит из слоев «узлов», которые передают друг другу сигналы; в процессе обучения связи между важными узлами усиливаются.

Уровень 3 (Почему важно): позволяет ИИ распознавать лица, понимать речь и рисовать картины, имитируя человеческое восприятие.

Связи: Машинное обучение (родственное), Глубокое обучение (частное).

«Когда говорят, знаем ли мы, как работает нейронная сеть, подразумевают, что можно запрограммировать нейронную сеть так, чтобы она работала». [Дегтярева Анна. Футурология и искусственный интеллект // «Знание ― сила», 2020]

НКРЯ / Russian National Corpus

Уровень 1 (Суть): «цифровая библиотека» всех когда-либо написанных русских текстов, используемая как эталон живого языка.

Уровень 2 (Как работает): база данных с миллиардами слов, снабженная поиском и разметкой (кто, когда и в каком смысле использовал слово).

Уровень 3 (Почему важно): фундамент для обучения отечественных ИИ-моделей правильному и богатому русскому языку.

Связи: Корпус текстов (родственное), Цифровая лингвистика (наука).

«Национальный корпус русского языка охватывает период от первых восточнославянских памятников (XI век) до первых десятилетий XXI века. Он представляет как язык предшествующих эпох, так и современный, в разных социолингвистических вариантах – литературном, разговорном, просторечном, диалектном. В корпус включаются, в частности, произведения художественной литературы (проза, драматургия, поэзия, звучащая речь кино), имеющие культурную значимость, а также представляющие интерес с точки зрения языка. Но Национальный корпус ни в коей мере не является только корпусом языка художественной литературы или тем более образцовых с точки зрения литературной нормы текстов. Основная масса вошедших в него текстов представляет речевые жанры во всем их многообразии: мемуары, эссеистика, публицистика, научно-популярная и научная литература, публичные выступления и частная устная речь, переписка (в том числе в Интернете), дневники (в том числе блоги), частные документы, любительская поэзия и т.п.» (ruscorpora.ru/page/corpora-about)

ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА / NLP (Natural Language Processing)

Уровень 1 (Суть): это умение машины «слышать» и «говорить» на человеческом языке, понимая не только слова, но и смысл.

Уровень 2 (Как работает): текст разбивается на токены, преобразуется в цифры (векторы) и анализируется нейросетью для понимания контекста.

Уровень 3 (Почему важно): позволяет создавать чат-ботов, переводчиков и системы анализа настроений в обществе.

Связи: Языковая модель (родственное), Цифровая лингвистика (научная база).

«Месопотамия онлайн: как искусственный интеллект расшифровывает древние тексты Компьютерная лингвистика, а точнее обработка естественного языка (Natural Language Processing, NLP), с недавнего времени стала одним из самых популярных направлений науки. Ее методы позволяют автоматически заменить в сообщении матерное междометие на имя девушки, убавить громкость колонок, не вставая с дивана, или перевести меню по фотографии. А группа исследователей-энтузиастов решила применить технологию машинного анализа в изучении текстов давно исчезнувших цивилизаций. Теперь компьютеры должны помочь нам перевести письмена, созданные несколько тысячелетий назад». [Калмыкова Оксана. Месопотамия онлайн: как искусственный интеллект расшифровывает древние тексты (2019.03)]

СЛОВАРЬ РУССКИХ СЛОВАРЕЙ

Уровень 1 (Суть): «Словарь всех словарей» – грандиозный архив, собирающий воедино опыт русской лексикографии за столетия.

Уровень 2 (Как работает): систематизация тысяч словарных источников в единую базу данных для анализа эволюции слов и смыслов.

Уровень 3 (Почему важно): позволяет проследить, как менялись понятия, и создает фундамент для метаязыка современного ГИЗАУРУСа.

Связи: ГИЗАУРУС (продолжение традиции), Генеральный словник (часть).

[Лесников С. В. Словарь русских словарей. М.: Азбуковник, 2002].

ЦИФРОВАЯ ГРАМОТНОСТЬ / Digital Literacy

Уровень 1 (Суть): современное «умение читать и писать» – способность не просто нажимать на кнопки, а понимать логику цифрового мира.

Уровень 2 (Как работает): включает навыки поиска информации, проверки фактов (фактчекинг), защиты данных и эффективного общения с алгоритмами.

Уровень 3 (Почему важно): без неё человек становится уязвимым для манипуляций, дезинформации и «алгоритмического рабства».

Связи: ГИЗАУРУС (инструмент), Инклюзивность (цель).

«Именно поэтому мы готовы обсудить, каким образом цифровая грамотность будет преподаваться в российских школах», – сказал депутат». [В Госдуме обсудят внедрение цифровой грамотности в школах // Парламентская газета, 2021.05.20]

ЦИФРОВАЯ ЛИНГВИСТИКА / Digital Linguistics

Уровень 1 (Суть): наука о том, как человеческий язык живет, анализируется и создается внутри компьютеров.

Уровень 2 (Как работает): применение математических методов и алгоритмов ИИ для изучения грамматики, смыслов и истории языка.

Уровень 3 (Почему важно): позволяет переводить с любого языка, понимать эмоции в тексте и создавать ГИЗАУРУСы.

Связи: NLP (приложение), Метаязык (инструмент).

«Цифровая лингвистика – это современная междисциплинарная область знаний, расположенная на стыке лингвистики, IT-технологий и социальных дисциплин. Эта наука делает акцент на разработке моделей и обработке естественного языка с использованием вычислительных методов, а также на изучении лингвистических проблем с помощью определенных подходов. Главная задача цифровой лингвистики: предоставить исчерпывающий набор теоретических, практических инструментов для коммуникации в эпоху цифровых технологий. Всё это предполагает наличие лингвистических знаний, таких как хорошее владение родным и иностранными языками. Ряд характеристик подтверждает обоснованность выделения цифровой лингвистики в отдельную научную дисциплину». (scipress.ru/philology/articles/vazhnost-tsifrovoj-lingvistiki-v-epokhu-iskusstvennogo-intellekta.html)

ЦИФРОВОЙ СУВЕРЕНИТЕТ / Digital Sovereignty

Уровень 1 (Суть): «цифровая независимость» – право человека, сообщества или страны контролировать свои данные, законы и технологии.

Уровень 2 (Как работает): создание собственных ИИ-моделей, хранение данных внутри страны и использование открытого ПО (Open Source).

Уровень 3 (Почему важно): защищает от технологического шантажа, слежки и зависимости от иностранных корпораций.

Связи: Безопасность (цель), Регулирование ИИ (инструмент).

««Традиционные подходы к построению и обеспечению информационной безопасности сетей связи спецпотребителей, основанные на использовании ресурсов сетей связи общего пользования, не обеспечивают защиту сетей связи и систем управления от кибервоздействий, от вредоносных программ при реализации информационных спецопераций, атак кибертеррористов и других киберпреступлений», – констатирует источник «Ъ» в правительстве»… заимствуем только самый лучший мировой опыт ― цифровой суверенитет у Китая, второй интернет у Ирана… а самое забавное, это про Cisco и зависимость от американских технологий%) весь мир опасается зависимости от китайского Huawei, который и дешевле и по технологиям не уступает Cisco… карго-культ в России все таки развит очень хорошо…» Подробнее: kommersant. ru/ doc/ 2265143 [vk (28.08.2013)]

ЧЕЛОВЕКО-МАШИННОЕ ВЗАИМОДЕЙСТВИЕ / HCI (Human-Computer Interaction)

Уровень 1 (Суть): наука о том, как сделать общение человека и компьютера таким же удобным и естественным, как разговор с другом.

Уровень 2 (Как работает): исследование психологии пользователя, проектирование интерфейсов и тестирование удобства (юзабилити).

Уровень 3 (Почему важно): плохой интерфейс делает даже гениальный ИИ бесполезным; HCI обеспечивает доступность технологий.

Связи: UX (практика), Юзабилити-тестирование (метод).

«Интерфейсы HMI (Human Machine Interface) в промышленной автоматике принципиально отличаются от пользовательских экранов офисных или бытовых систем. Если в обычном интерфейсе важны эстетика и интерактивность, то в промышленном – приоритетом являются надёжность, читаемость и устойчивость к ошибкам. Каждое действие оператора напрямую влияет на работу реального оборудования, поэтому интерфейс должен быть предельно логичным, безопасным и предсказуемым. Главная цель HMI – обеспечить эффективное взаимодействие человека и машины. Это не просто „дисплей управления“, а инструмент, через который оператор контролирует технологический процесс, наладчик производит настройку и диагностику, а инженер оценивает эффективность оборудования». (hnc-electric.ru/articles/kak-proektirovat-hmi-pod-roli-operatora-naladchika-i-inzhenera/)

ЭТИКА ИИ / AI Ethics

Уровень 1 (Суть): это «совесть технологий» – правила, которые мешают ИИ быть несправедливым, предвзятым или опасным.

Уровень 2 (Как работает): внедрение в код и законы ограничений, защищающих права человека, прозрачность решений и равенство.

Уровень 3 (Почему важно): ИИ лишен врожденной морали; без этики он может усилить дискриминацию и социальную вражду.

Связи: Регулирование (родственное), Смещение/Bias (проблема).

«Ожидается выступление руководителя Лаборатории нейронаук и поведения человека Сбербанка Андрея Курпатова. Спикерами станут и другие представители крупнейших международных и российских компаний. Второй день форума посвятят прикладному применению научных разработок в различных сферах бизнеса и общественной жизни. Дискуссии пройдут в секциях „ИИ и умные города“, „ИИ и ретейл“, „ИИ и промышленность“, „ИИ и этика“, „ИИ и телеком“, „ИИ и финансовый сектор“, „ИИ и медицина“, „Тренды развития ИИ“. Также состоится панельная дискуссия „ИИ и страхование“.» [В Москве впервые пройдет крупнейший форум Восточной Европы по искусственному интеллекту // Известия, 07.11.2019]

Список базовых сокращений:

– ИИ – искусственный интеллект

– ГИЗАУРУС – гипертекстовый тезаурус

– AGI – Artificial General Intelligence (общий ИИ)

– LLM – Large Language Model (большая языковая модель)

– UX – User Experience (пользовательский опыт)


Для издания, которое позиционируется не просто как теоретическая монография, а как ГИЗАУРУС-навигатор и интенсив-курс, нетрадиционное расположение библиографии (в начале, а не в конце) превращает её из «бюрократического списка» в активный фундамент и карту знаний.


Обоснование нетрадиционного расположения библиографии в ГИЗАУРУСе

1. Библиография как «Карта навигации» (координаты ГИЗАУРУСа)

Поскольку ГИЗАУРУС – это словарь-навигатор, библиография в начале книги выступает в роли «точек старта». Читатель (пол (ь) зователь) сразу видит масштаб информационного поля. Это превращает список литературы из архива в инструментарий первого касания: прежде чем изучать термины, пользователь получает доступ к первоисточникам, на которых эти термины базируются.

2. Установление доверия через «Прозрачность алгоритма»

В концепции ИИ важна «объяснимость» (XAI). Размещая 250+ источников (от Тьюринга 1950-х до Катанова 2025-го) в самом начале, автор «раскрывает карты», показывая, что ГИЗАУРУС – это не субъективное мнение, а результат синтеза колоссального массива стандартов (ГОСТ), законов и академической мысли. Это мгновенно снимает барьер недоверия у профессиональной аудитории.

3. Приоритет безопасности и правового поля (Буква «З» в ГИЗАУРУСе)

ГИЗАУРУС заявлен как Защищённый. Размещение разделов «ГОСТ», «ПНСТ» и «Указы и ФЗ» сразу после сокращений подчеркивает: использование ИИ в представленной модели жёстко регламентировано. Пользователь сначала видит границы правового и этического поля, а затем – технологические возможности. Это формирует ответственный подход к ИИ.

4. Поддержка нелинейного чтения и UX-дизайна

Современный «пол (ь) зователь» не читает монографии линейно. Он ищет конкретный термин или сервис. Расположение библиографии в начале – это эффективный UX-прием: в электронной версии книги это избавляет от необходимости бесконечного скроллинга в конец файла. Список литературы становится «панелью быстрого доступа».

5. Валидация связки «Понятие – Действие»

На страницу:
2 из 13