Учебный кейс
Тема кейса/ занятия: Нейросеть как новая перспектива человечества
Область: наука о данных
Автор кейса:
Бурибо В.Ю.
Краткая аннотация кейса:
Ознакомить людей с нейросетью, т. к. это новое направление в науке, и оно еще недостаточно популяризировалось в России.
Цель: изучение существующих типов нейронных сетей и возможности их применения
Краткое описание хода выполнения: изучили материал по данной теме; разобрались с понятием «Нейронная сеть»; узнали, что такое нейрон; узнали принцип работы нейронной сети; сравнили типы; рассмотрели особенности и применение. Типы задач, которые решают нейронные сети.
Что такое нейросеть?
Нейронная сеть — это метод в искусственном интеллекте, который учит компьютеры обрабатывать данные таким же способом, как и человеческий мозг. Это тип процесса машинного обучения, называемый глубоким обучением, который использует взаимосвязанные узлы или нейроны в слоистой структуре, напоминающей человеческий мозг. Он создает адаптивную систему, с помощью которой компьютеры учатся на своих ошибках и постоянно совершенствуются. Таким образом, искусственные нейронные сети пытаются решать сложные задачи, такие как резюмирование документов или распознавание лиц, с более высокой точностью.
Что такое нейрон?
Идея нейронных сетей была позаимствована у природы, а точнее в качестве аналога использовалась нервная система животных и человека. Нервная система состоит из огромного количества элементов – нейронов.
Биологический нейрон является важнейшим элементом клеток нервной системы и строительным материалом мозга. Нейроны существуют в нескольких форма, в зависимости от их назначения и дислокации, но в целом они схожи по структуре.
Каждый нейрон является устройством обработки информации, которое получает сигналы от других нейронов через специальную структуру ввода, состоящую из дендритов. Если совокупный входной сигнал превышает пороговый уровень, то клетка передает сигнал далее в аксон, а затем в структуру вывода сигнала, от которой он передается в другие нейроны. Сигналы передается с помощью электрических волн. В течение жизни у человека число нейронов не увеличивается, но растет число связей между ними, как результат обучения.
Органы чувств человека состоят из большого числа нейронов, соединенных между собой множеством связей. Орган чувств включает в себя рецепторы и проводящие пути. В рецепторах формируются электрохимические сигналы. Они кодируют различные виды сигналов в единый универсальный частотно-импульсный код.
Принцип работы
У каждого нейрона есть входы, через которые он принимает сигнал. Поступившие на входы сигналы умножаются на свои веса. На слайде веса изображены кружками. Сигнал первого входа x1 умножается на соответствующий этому входу вес w1. В итоге получаем x1*w1. И так до n-ого входа. В итоге на последнем входе получаем xn*wn.
Теперь все произведения передаются в сумматор. Он суммирует все входные сигналы, умноженные на соответствующие веса.
Место соединения выхода одного нейрона и входа другого называется синапсом, при этом сигнал при прохождении через синапс либо усиливается, либо ослабляется.
Получается, что на результат влияют не нейроны, а именно синапсы, дающие определённую совокупность веса входных данных, так как сами нейроны каждый раз выполняют совершенно одинаковые вычисления.
Виды нейронных сетей
Есть десятки видов нейросетей, которые отличаются архитектурой, особенностями функционирования и сферами применения. При этом чаще других встречаются сети трех видов.
Нейронные сети прямого распространения (Feed forward neural networks, FFNN). Прямолинейный вид нейросетей, при котором соседние узлы слоя не связаны, а передача информации осуществляется напрямую от входного слоя к выходному. FFNN имеют малую функциональность, поэтому часто используются в комбинации с сетями других видов.
Сверточные нейронные сети (Convolutional neural network, CNN). Состоят из слоев пяти типов:
входного;
свертывающего;
объединяющего;
подключенного;
выходного.
Каждый слой выполняет определенную задачу: например, обобщает или соединяет данные.
Сверточные нейросети применяются для классификации изображений, распознавания объектов, прогнозирования, обработки естественного языка и других задач.
Рекуррентные нейронные сети (Recurrent neural network, RNN). Используют направленную последовательность связи между узлами. В RNN результат вычислений на каждом этапе используется в качестве исходных данных для следующего. Благодаря этому, рекуррентные нейронные сети могут обрабатывать серии событий во времени или последовательности для получения результата вычислений.
RNN применяют для языкового моделирования и генерации текстов, машинного перевода, распознавания речи и других задач.
Типы задач, которые решают нейронные сети
Выделяют несколько базовых типов задач, для решения которых могут использоваться нейросети.
Классификация. Для распознавания лиц, эмоций, типов объектов: например, квадратов, кругов, треугольников. Также для распознавания образов, то есть выбора конкретного объекта из предложенного множества: например, выбор квадрата среди треугольников.
Регрессия. Для определения возраста по фотографии, составления прогноза биржевых курсов, оценки стоимости имущества и других задач, требующих получения в результате обработки конкретного числа.
Прогнозирования временных рядов. Для составления долгосрочных прогнозов на основе динамического временного ряда значений. Например, нейросети применяются для предсказания цен, физических явлений, объема потребления и других показателей. По сути, даже работу автопилота Tesla можно отнести к процессу прогнозирования временных рядов.
Кластеризация. Для изучения и сортировки большого объема неразмеченных данных в условиях, когда неизвестно количество классов на выходе, то есть для объединения данных по признакам. Например, кластеризация применяется для выявления классов картинок и сегментации клиентов.
Генерация. Для автоматизированного создания контента или его трансформации. Генерация с помощью нейросетей применяется для создания уникальных текстов, аудиофайлов, видео, раскрашивания черно-белых фильмов и даже изменения окружающей среды на фото.
Ответы на вопросы:
1. Кто столкнулся с проблемой?
1.1 Кто является заинтересованной стороной?
Заинтересованной стороной являются программисты, исследователи и просто рядовые пользователи.
1.2 Что вы о них знаете?
Я знаю о них, то, что они используют нейросети в работе или просто так. Ведь нейросеть может помочь с кодом или в исследованиях, или просто создать интересную картинку.
2. Каков характер проблемы нейросети?
2.1 В чем состоит проблема?
1. Самое, казалось бы, простое, но нейросеть
не учитывает факты. Нейросеть выучивается на частных фактах, но как бы не знает
о них. На когнитивном языке NN обладает семантической, а не эпизодической
памятью грубо говоря.
Решение может есть простое,
но нейросеть — классификатор, а прецеденты не могут быть классами,
противоречие. А часто нужен именно такой ответ от ботов, они очень плохо
работают с фактами, если речь не о шаблон «ответе». Проблема усугубляется тем,
что всегда есть исключения, которые не может учитывать сеть, если у нее не было
достаточно примеров с исключением. А если примеров достаточно — это не
исключение. В общем, NN может сказать, что это шляпа, но не может сказать,
какая шляпа моя (был только один пример).
2. «Здравый
смысл». Известная проблема, названная даже «темной материей ИИ». Есть
интересные подходы к решению, например, в этой статье, где описывается
попытка совместить символический (логический) ИИ и нейросетевые подходы. Но это
попытка пойти назад, вместо того чтобы пойти вперед. Проблема же в том, что
«здравый смысл» — это неявные знания о мире, которых не было в обучающей
датасете. Такие банальности никто даже не произносит, их узнают в 4-6 лет,
когда еще не умеют писать. Громкие неудачи проектов Компрено и Cyc показывают,
что описать явно все факты невозможно. Они как-то выводятся налету. Хороших
идей решения пока нет, кроме ограничения словаря. Например, «школьник» должен
«наводить» такие «фильтры» на лексикон ответа, чтобы в выбираемых вариантах не
было слов «армия» или «женитьба», если речь идет о нем самом, а не о
присутствии на свадьбе старшего брата. Как этой сделать в NN не (мне) понятно.
3. Не
менее важной проблемой, а возможно связанной с предыдущей — это проблема
построения рассуждений. Нейросети не умеют делать силлогизмы, то есть
простейшие выводы с последовательными рассуждениями (промежуточными выводами).
Эта же проблема с другой стороны — невозможность преследовать цель рассуждений
или хотя бы придерживаться определенного смысла. GPT может построить текст
новости на заданную тему, но ей бесполезно говорить, «напиши новость, чтобы
очернить Х». В лучшем случае она напишет про очернение другими, причем в явном
виде, а не как мы, люди, между строк. Вывод силлогизма — это тоже цель — надо
соотносить предпосылки с выводом. Иметь его ввиду при первом же высказывании
(посылке). Пока даже не понятно, «с какой стороны» это заложить в сеть. Может
кто знает?
4. И
еще одна проблема, которая даже не темная материя, а черная дыра ИИ. Это
аналогии и метафоры. ИИ все понимает только буквально. Ей бесполезно говорить,
«похожий на Х». Сеть может дополнить описание, но не описать аналог. Может быть
это просто проблема соответствующего датасета. Но мне кажется она глубже и показывает
корневой «недостаток» нынешних архитектур ИИ как и п.3. Наш язык сплошь
метафоричен, отсюда же произрастает «проклятие лингвистов» — омонимия. Одни и
те же лексемы через метафоры используются в куче разных «концептов». И мы легко
в этом ориентируемся. Частично это решается в задаче определения интентов, но
это опять же определение «темы», а не всего концепта, состоящего не только из
названия интента и связанных с ним шаблонов ответов как в ботах.
2.2 Откуда вы знаете, что это является проблемой?
Я знаю, что это является проблемами нейросети, так как она не умеет думать, как человек, а лишь генерировать ответы на вопросы.
3. Где возникла проблема?
3.1 Каковы контекст или ситуация, в которых заинтересованные стороны испытывают проблему?
Заинтересованные стороны испытывают проблему при разных ситуациях:
Рядовые пользователи при попытке создать картину могут столкнуться с чудищем или кривым домом, ведь нейросеть может неправильно понять то, что от неё требуется.
Программисты сталкиваются с проблемой обучения нейросети, ведь она ищет способы решения задачи как быстрее, но не всегда честно.
Исследователи сталкиваются с такими же проблемами, но в области науки.
4. Почему вы считаете, что эту проблему следует решить?
4.1 Что имеет ключевое значение для заинтересованных сторон?
Заинтересованные лица делают всё, чтобы нейросеть умела думать, как человек, рассуждать и т.д.
4.2 Как ваше решение изменит ситуацию?
Нейросеть начнёт понимать, что от неё хотят.
Используемые источники:
https://sbercloud.ru/ru/services/neural-networks
https://aws.amazon.com/ru/what-is/neural-network/
https://habr.com/ru/post/520748/
Здравый смысл приближается к компьютерам | Журнал «Кванта» (quantamagazine.org)
Скачано с www.znanio.ru
© ООО «Знанио»
С вами с 2009 года.