Нейрокомпьютинг и его применения в экономике и бизнесе


Типы обучения нейросети


Ошибка сети зависит, как уже говорилось, от конфигурации сети - совокупности всех ее синаптических весов. Но эта зависимость не прямая, а опосредованная. Ведь непосредственные значения весов скрыты от внешнего наблюдателя. Для него сеть - своего рода черный ящик, и оценивать ее работу он может лишь основываясь на ее поведении, т.е. на том, каковы значения выходов сети при данных входах. Иными словами, в общем виде функция ошибки имеет вид:

 E(w)=E\{x^\alpha,y^\alpha,y(x^\alpha,w)\}

Здесь

\{x^\alpha,y^\alpha\}
- набор примеров (т.е. пар входов-выходов), на которых обучается нейросеть, а
\{y(x^\alpha,w)\}
- реальные значения выходов нейросети, зависящие от конкретных значений ее синаптических весов. Такой способ обучения, когда действительный выход нейросети сравнивают с эталонным, называют обучением с учителем.

Иногда выходная информация известна не полностью. Например, вместо эталонных ответов известно лишь хуже или лучше данная конфигурация сети справляется с задачей (вспомним детскую игру "холоднее-горячее" или лабораторную мышь в лабиринте с лакомствами и электрошоком). Этот тип обучения называют обучением с подкреплением (reinforcement learning).

Вообще говоря, возможен и такой режим обучения, когда желаемые значения выходов вообще неизвестны, и сеть обучается только на наборе входных данных:

\{x^\alpha\}

 E(w)=E\{x^\alpha,y(x^\alpha,w)\}

Такой режим обучения сети называют обучением без учителя. В этом случае сети предлагается самой найти скрытые закономерности в массиве данных. Так, избыточность данных допускает сжатие информации, и сеть можно научить находить наиболее компактное представление таких данных, т.е. произвести оптимальное кодирование данного вида входной информации.

Таблица 2.5. Сравнение режимов обучения нейросетей

Вид обучения:С "учителем"С "подкреплением"Без "учителя"
Что подается в качестве обучающих примеровНабор пар входов-выходов
\{x^\alpha,y^\alpha\}
Оценка выходов сети
\{x^\alpha,y(x^\alpha)\}
Только набор входных значений
\{x^\alpha\}
Что требуется от сетиНайти функцию, обобщающую примеры, в случае дискретных
y^\alpha
- классифицировать входы. В целом - научиться реагировать схожим образом в схожих ситуациях.
Научиться заданной "правильной" линии поведения.Найти закономерности в массиве данных, отыскать порождающую данные функцию распределения, найти более компактное описание данных.




Начало  Назад  Вперед