Как работает нейросеть: объяснение простым языком

0
35

Нейросеть: что это такое простым языком

Введение в искусственные нейронные сети и машинное обучение - изображение номер один
Введение в искусственные нейронные сети и машинное обучение — изображение номер один

Искусственная нейронная сеть (ИНС, Neural Network) — это программа, которая может обучаться на массиве данных и примеров. Хитрость в том, что алгоритмы в нейросети устроены подобно нейронам в мозгу человека. Они связаны между собой и могут передавать друг другу сигналы. От последних зависит обучение. К примеру, в случае с собаками нейросеть формирует сильные связи между нейронами, которые распознают хвост, морду, усы.

Интерес к нейронным сетям возник еще в середине XX века. В 1943 американские ученые Уоррен Мак-Каллок и Уолтер Питс создали модель, в которой нейроны рассматриваются как устройства, способные работать с двоичными числами и выполнять некоторые логические операции.

В 1958 году Фрэнк Розенблатт создал первый нейрокомпьютер — вычислительную систему «Марк-1». Mark 1 умел распознавать некоторые буквы английского алфавита. Эту возможность он получил благодаря перцептронам — математической модели человеческого мозга, состоящей из трех элементов:

  • датчики, от которых поступают сигналы;
  • ассоциативные элементы;
  • реагирующие датчики.

Исследования в области neural network продолжились в 1970–1980-е годы. В 1982 г. Дж. Хопфилд представил ассоциативную Hopfield network. Выводы, сделанные ученым, Ричард Липпманн использовал для создания нейросети Хэмминга (1987 год). Она научилась распознавать черно-белые изображения: например, индекс на почтовых конвертах.

В 1984 году финский ученый Т. Кохонен предложил нейросеть с обучением без учителя Self-organizing map — SOM, которая позволяла кластеризировать и визуализировать данные.

Вопросами машинного обучения занимались Дж. Андерсон, Бернард Уидроу, М. М. Бонгард, Пол Дж. Вербоси другие. Долгое время сфера ИИ была узкоспециализированной: ею занимались ученые и программисты. Вычислительные мощности и более сложные алгоритмы машинного обучения, которые появились в 1990–е, ознаменовали новую эту ИИ: компьютерная система Deep Blue обыграла чемпиона мира по шахматам Гарри Каспарова, робот-гуманоид Kismet научился моделировать эмоции человека, роботы-геологи Opportunity и Spirit отправились на Марс и передавали данные на Землю без вмешательства человека. В 2011 году Apple выпустила виртуального помощника Siri, а в 2014 Microsoft представила Cortana.

С выходом ChatGPT, GigaChat, Midjourney и Bard сети получили новый виток развития и популярность у массового пользователя..

Как работает нейронная сеть

Что такое нейросеть и как она помогает специалистам: объяснение с примерами - изображение номер два
Что такое нейросеть и как она помогает специалистам: объяснение с примерами — изображение номер два

Разберем, как работает нейросеть, на примере GigaChat. Программный продукт Сбера умеет:

  • отвечать на вопросы;
  • поддерживать диалог;
  • делать выжимки (саммари) из текста;
  • писать код и объяснять его;
  • генерировать изображения.

«ГигаЧат» работает на русском и английском языках. Со стороны пользователя работа выглядит так:

  1. Задается вопрос (формируется промпт).
  2. ГигаЧат опознает тип запроса.
  3. Нейросеть обращается к знаниям, выбирает стратегию ответа.
  4. Пользователь получает ответ.

Базовая версия GigaChat работает в Телеграме, «ВКонтакте и на смарт-устройствах Sber. К примеру, можно запустить в Telegram бота — @gigachat_bot, а после клика на /start сформулировать запрос: «Расскажи, что такое и для чего используется». Вы получите ответ:

Информация о GitVerse верна, но не совсем актуальна. Уже доступен Kandinsky 3.1, а сам хостинг репозиториев вышел из тестирования. Причина в том, что пока у GigaChat нет доступа в интернет. Это значит, что нейросетевая модель не сообщит вчерашние новости и не будет знать, какой сегодня день.

Но ИИ выдает контент на основе более 300 Гб данных: научные статьи, книги, комментарии на форумах, публикации СМИ, разговорная речь и т.д. Каждый пользователь обучает нейросеть, когда ставит лайк или дизлайк ответу. О нюансах обучения neural network мы расскажем ниже.

Какие задачи решают нейронные сети

Нейросеть - что это такое простыми словами и как работает нейронная сеть - изображение номер три
Нейросеть — что это такое простыми словами и как работает нейронная сеть — изображение номер три

Возможности использования Neural Network зависят от того, что предусмотрели разработчики. Выделяют две разновидности:

  • одномодальные — умеют работать только с одним видом контента (например, генерировать текст или создавать изображения);
  • мультимодальные — могут создавать разные типы контента (тексты, изображения, видео, звук и т.д.).

К примеру, GigaChat относится к мультимодальным нейросетям: он умеет писать тексты и генерировать картинки. Через динамические модули возможны работа со звуком и интеграция с другими инструментами.

Задачи, которые помогают решать нейросети, можно объединить в несколько групп.

Таблица №1

Группа задач Для чего использовать Примеры использования
Классификация Распознать объекты и образы: лица, эмоции, фигуры, формулы, текст Распознать текст, транскрибировать речь, определить, имеет ли человек право на льготы
Регрессия Обработать входные данные и выдать результат Определить возраст по фото, составить прогноз биржевых котировок, оценить стоимость коммерческой недвижимости
Генерация Создать и/или изменить контент Сгенерировать тексты, создать изображения, раскрасить черно-белые фильмы, озвучить статью
Прогнозирование временных рядов Предсказать динамику объекта/процесса в зависимости от заданных критериев Смоделировать цены на коммерческую недвижимость, рассчитать увеличение/уменьшение объема потребления энергии, спрогнозировать риск пробок и заторов, предсказать стоимость акций компании
Кластеризация Обработать данные и объединить их по определенным признакам Выявить сегменты клиентов, отсортировать изображения и т.д.

Список задач, которые способны решать нейросети, постепенно расширяется. Искусственный интеллект может стать частью сложного программного продукта или системы. К примеру, сегодня ИИ уже используется в социальных сетях: он анализирует предпочтения пользователя и показывает ему контент, релевантный интересам. AI в банковских продуктах помогает экономить. Он анализирует расходы по карте за предыдущий период и подсказывает клиенту, какую категорию кэшбэка лучше выбрать на будущий месяц.

Виды нейросетей

Нейронные сети на службе энергетиков - изображение номер четыре
Нейронные сети на службе энергетиков — изображение номер четыре

В зависимости от архитектуры выделяют десятки типов нейронных сетей. Часто типы называют в честь ученых: сеть Джордана, Элмана, Хэмминга, Ворда, Хопфилда, Кохонена, Розенблатта.

Институт Азимова (The Asimov Institute) попытался систематизировать разновидности нейронных сетей. Так появился «зоопарк» — «The Neural Network Zoo».

  1. Перцептроны — первая модель, созданная Фрэнком Розенблаттом. Машина умела сканировать картинки, превращать их в сигнал, обрабатывать и выдавать результат. Он был бинарным, т.е. выглядел как 1 или 0.
  2. Многослойные — доработанная модель Розенблатта умела работать с десятичными числами и использовала несколько обучаемых слоев. Благодаря этому ИНС могла более гибко решать задачи. К примеру, многослойная Neural Network могла распознать объект вне зависимости от тени или угла наклона.
  3. Рекуррентные — модели, которые запоминают последовательность (цепочку данных), понимают ее и предсказывают, что будет дальше. На основе массива данных нейронная сеть может продолжить предложение: «GitVerse — это российская программная платформа для…» фразой «работы с исходным кодом».
  4. Сверточные — архитектура, созданная для распознавания образов и работы с изображениями. Подобные модели используют слои свертки, активации и пулинга. На вход поступает изображение, которое нейросеть «послойно нарезает». Затем в каждом слое ищет самые важные признаки.
  5. Генеративные — модели, которые создают что-либо (как правило, текст и изображения). Среди актуальных — GigaChat, Kandinsky, GPT.

Как обучаются нейросети

Методы и алгоритмы обучения нейросетей - изображение номер пять
Методы и алгоритмы обучения нейросетей — изображение номер пять

GigaChat (как GPT и некоторые другие генеративные) — большая языковая модель (Large Language Model, LLM). Она учится на корпусе данных: книги, научные статьи, комментарии на форумах, исследования, пособия, инструкции, веб-страницы в интернете и т.д. Процесс можно сравнить с тем, как учат маленьких детей: «Смотри, это зеленый цвет, а это — машина».

Языковая модель обрабатывает информацию и запоминает последовательность слов, построение предложений, связанность тем. В общем, все почти как у людей, за исключением одного нюанса: ИИ не понимает смысла слов так, как его понимают люди. На любой вопрос искусственный интеллект дает ответ, похожий на те многочисленные тексты, на которых учился.

  1. Pretraining (обучение базовой языковой модели) — программе «скармливают» корпус данных. Она изучает информацию и учится предсказывать, каким будет следующее слово в предложении на основе алгоритма распределения вероятностей.
  2. Finetuning (дообучение) — Large Language Model учится не только предсказывать следующее слово в предложении, но и отвечать на конкретные вопросы. Чтобы дообучить LLM, используют чистые данные, собранные вручную. На этапе Finetuning с ЯМ работают специалисты из различных областей: финансисты, биологи, медики, юрист, инженеры.

GigaChat дообучается по методу supervised fine-tuning, reinforcement learning with human feedback прямо в процессе работы. Каждый раз, когда пользователь ставит лайк или дизлайк комментарию от Neural Network, она учится отвечать подробнее, точнее, профессиональнее.

Преимущества и недостатки нейросетей

НЕЙРОСЕТИ - изображение номер шесть
НЕЙРОСЕТИ — изображение номер шесть

Чтобы оценить все плюсы и минусы нейросетевых моделей, стоит попробовать применять их в бизнесе и в жизни.

Преимущества нейросетей сводятся к автоматизации рутины в различных сферах: маркетинг, SEO-продвижение, распознавание текстов, аналитика данных, составление отчетов и прогнозирование. ИИ экономит время и ресурсы специалистов на различных уровнях: управление и менеджмент, бухгалтерия.

  • помогает «выйти из плоскости», подсказывает подходы к решению задач;
  • экономит время на рутинных операциях, аналитике, отчетах;
  • выполняет часть задач, для решения которых раньше приходилось выделять отдельного специалиста (транскрибация, распознавание сканов).

Large Language Model может быть частью сложных продуктов и систем: чат-боты, голосовые помощники, виртуальные ассистенты.

  1. Результат работы зависит от корпуса данных, на которых обучали LLM. К примеру, GigaChat и отечественные разработки лучше учитывают культурный код России по сравнению с зарубежными аналогами (и наоборот).
  2. Потребление ресурсов. ИИ-технологии основаны на сложных вычислениях. Для этого нужно качественное «железо» в центрах обработки данных. Запросы растут, повышается нагрузка на ЦОДы, увеличивается потребление электроэнергии и других ресурсов (например, воды, необходимой для охлаждения).
  3. Риск «галлюцинаций» и ошибок. Несмотря на постоянное обучение и совершенствование, Large Language Models могут давать неверные ответы и ошибаться. Поэтому часто требуются фактчекинг и дополнительные проверки.
  4. Необходимость использовать промпты. Чтобы Neural Network не давала расплывчатые поверхностные ответы, необходимо грамотно формулировать запрос, т.е. prompt. Появилось даже отдельное направление в IT — промпт-инжиниринг.
  5. Неспособность решать часть задач. LLM и искусственный интеллект хороши для работы с рутиной и автоматизацией процессов. Но с созданием чего-то принципиально нового, научными открытиями и тому подобным ИИ не справляется.

Тексты и изображения, которые генерируют модели, зачастую имеют «характерный почерк». Картинки можно узнать по слегка размытым плавным линиям. Изображений стало так много, что есть риск формирования аналога «баннерной слепоты». Пример изображения от Kandinsky 3.1 по запросу: «Нарисуй программиста, который пишет код с использованием платформы GitVerse. В браузере открыта страница сайта».

Частые вопросы о нейросетях

Вопрос: Нейросеть и искусственный интеллект — это одно и то же?
Ответ: Нет, это не одно и то же. Искусственный интеллект (ИИ) — это обширная область компьютерных наук, целью которой является создание машин, способных выполнять задачи, требующие человеческого интеллекта. Нейросеть — это один из инструментов и подходов, используемых для достижения целей ИИ, вдохновленный работой человеческого мозга.

Вопрос: Нужно ли нейросети подключение к интернету для работы?
Ответ: Не всегда. Нейросеть может работать как онлайн (запросы отправляются на удаленный сервер), так и офлайн, если она полностью установлена на устройство (например, в некоторых приложениях для распознавания фото или голоса). Однако для обучения сложных моделей и доступа к мощным вычислительным ресурсам обычно требуется интернет.

Вопрос: Может ли нейросеть «думать» или осознавать себя?
Ответ: Нет, современные нейросети не обладают сознанием, мышлением или самосознанием. Они являются сложными статистическими моделями, которые находят закономерности в данных. Их «решения» — это результат математических вычислений, а не процесс размышления.

Вопрос: Почему нейросети иногда дают неправильные или странные ответы?
Ответ: Это происходит из-за ошибок в данных для обучения, неполного обучения или ситуаций, сильно отличающихся от тех, что были в обучающей выборке. Нейросеть обобщает полученный опыт, и если этот опыт был ограниченным или смещенным, результаты могут быть некорректными.

Вопрос: Что такое «обучение» нейросети?
Ответ: Обучение нейросети — это процесс настройки внутренних параметров («синаптических весов») на большом наборе примеров. Сеть многократно обрабатывает данные, и алгоритм постепенно уменьшает разницу между ее предсказаниями и правильными ответами, улучшая точность.

Вопрос: Чем нейросеть отличается от обычной компьютерной программы?
Ответ: Обычная программа выполняет строгий алгоритм, написанный человеком («если условие А, то сделай Б»). Нейросеть не программируют в классическом смысле — ее обучают на данных, и она сама выявляет скрытые правила и взаимосвязи для решения задачи.

Вопрос: Может ли нейросеть обучаться бесконечно и становиться бесконечно умной?
Ответ: Нет, возможности нейросети ограничены ее архитектурой, объемом и качеством данных для обучения, а также вычислительными ресурсами. После определенного момента дополнительное обучение на тех же данных перестает улучшать результаты или даже ухудшает их (переобучение).

Вопрос: Что такое «нейрон» в нейросети?
Ответ: Нейрон (или искусственный нейрон) — это базовая математическая единица сети. Он получает один или несколько входных сигналов, умножает их на определенные коэффициенты (веса), суммирует, добавляет смещение и пропускает результат через специальную функцию (функцию активации), чтобы получить выходной сигнал.

Вопрос: Правда ли, что нейросети скоро заменят все профессии?
Ответ: Нейросети автоматизируют рутинные задачи и меняют многие профессии, но вряд ли заменят все. Они эффективны в задачах анализа шаблонов, но слабы в областях, требующих истинного творчества, сложных социальных взаимодействий, эмпатии и стратегического мышления высокого уровня. Скорее, изменится характер работы.

Вопрос: Сложно ли создать свою простую нейросеть?
Ответ: Сегодня создать простую нейросеть стало гораздо проще благодаря множеству открытых библиотек и фреймворков (например, TensorFlow, PyTorch). Для базовых экспериментов достаточно знаний основ программирования и понимания ключевых концепций машинного обучения.

Краткая памятка: как понять принцип работы нейросети

  1. Представьте нейросеть как упрощенную математическую модель человеческого мозга, состоящую из слоев взаимосвязанных «нейронов».
  2. Каждый нейрон получает входные данные (числа), обрабатывает их по простой формуле и передает результат дальше.
  3. Связи между нейронами имеют «вес» — это коэффициент, который показывает силу и важность сигнала.
  4. Сеть имеет входной слой (получает данные), скрытые слои (обрабатывают) и выходной слой (выдает результат).
  5. Сеть изначально «глупая» — все веса в ней установлены случайным образом.
  6. Обучение — это процесс многократной подачи примеров (данные + правильный ответ) и автоматической подстройки весов.
  7. Цель обучения — минимизировать ошибку, чтобы на новых, незнакомых данных сеть давала максимально точный ответ.
  8. Для обучения нужны огромные наборы размеченных данных (например, тысячи фотографий с подписями, что на них изображено).
  9. Разные архитектуры сетей (сверточные, рекуррентные) лучше подходят для разных типов задач (изображения, текст, последовательности).
  10. После обучения сеть — это просто набор оптимизированных чисел (весов), который можно использовать для предсказаний.
  11. Нейросеть не «понимает» данные в человеческом смысле, она лишь вычисляет вероятности и находит статистические закономерности.
  12. Сила нейросетей — в способности находить сложные, неочевидные для человека паттерны в больших данных.