Комп'ютерні системи штучного інтелекту

2.8. Системи словесного спілкування (сс).

2.8.1.                         Основні положення.

До систем словесного спілкування відносяться синтезатори і аналізатори. Дослідження в області систем сс почалися в 60-х рр., в кінці 70-х появилися промислові зразки. Їх поява викликана наступними причинами:

•       Зручність, простота і природність, процедури спілкування, що потребують мінімальної підготовки;

•      Можливість використання для зв'язку з еом телефонної лінії;

•      Збільшення швидкості вводу інформації порівняно з клавіатурою і т.д.

Фонема - елементарна одиниця письмового тексту і абстрактне позначення конкретного звуку усної мови. На окремий звук впливають наступні фактори:

•      Індивідуальні особливості мови і голосу;

•      Емоційний і фізіологічний стан того, хто говорить;

•      Електроакустичні характеристики середовища і тракту передачі;

•      Шуми, завади, відхилення.

Розробка систем сс є лінгвоакустична і інформаційна теорія утворення слів і сприйняття слів.

Лінгвоакустична теорія розглядає акустичні і просодичні характеристики мови.

Акустична теорія розглядає акустичні характеристики фонем і просонем, а інформаційна теорія - структуру мовного сигналу.

2.8.2.                         Фонетична і просодична структура мови.

Мінімальною смисловою одиницею мови є звук. В російській мові 42 звуки (6 голосних і 36 приголосних). Акустичні характеристики кожного звуку обумовлюються артикуляційними особливостями його утворення, місцем і способом. Під місцем утворення розуміється положення артикуляційного тракту, визначаючи його конфігурацію. Місця утворення голосних звуків визначаються положенням тіла мови (переднє, заднє, високе, низьке) і положенням губ.

2.9. Сприйняття і обробка візуальної інформації.

2.9.1.                        Візуальне сприйняття людини.

Через візуальний канал людини в мозок поступає від 70% до 90% інформації.

Основні функції зору:

1)                            Загальна орієнтація в навколишньому середовищі (оцінка розмірів і форм об'єктів, просторова взаємодія між об'єктами, розпізнавання рухомих об'єктів і т.д.);

2)                        Розпізнавання об'єктів;

3)                        Запам'ятовування сцен, які спостерігалися;

4)                        Навчання і отримання нової інформації.

Найбільш суттєвими особливостями візуального сприйняття людини є наступні:

1)                Проблемна орієнтація. Система ока-мозку постійно підстроюється під ситуацію і в даний момент володіє суттєво меншою різновидністю реакцій, ніж потенційно вона допускає. Організм постійно шукає інформацію, що необхідна йому для дій і виділяє найбільш важливу в даний момент.

2)             Глобальність і локальність зору. Дослідження показали, що візуальний нерв першими пропускає низькі просторові частоти, які відповідають великим деталям зображення, а потім високочастотні стани, які відповідають дрібним локальним деталям.

3)               Множина форм бачення або контрастність сприйняття. Людини впізнає лице, пейзаж, предмет і т.д. І по чорно-білому і по кольоровому зображенні, і по контурному рисунку і т.д. В широких межах сприйняття немає різниці до розміру, яскравості, контрастності і орієнтації об'єкта.

4)             Міжпівкульна асиметрія сприйняття. Права півкуля зв'язана з конкретним предметним "мисленням" (просторово-образна), а ліва - візуальним навчанням (вироблення узагальнених понять, які представленні на основі візуальних образів).

5)       Отримання і використання знань.

2.9.2.                        Представлення відеоданих

Система сприйняття використовує наступні моделі представлення відеоданих;

1)                       Матрична чи пряма. Кожний елемент оцінюється яркістю або кольором.

2)                   Векторний. Кожний елемент описується відрізком прямої лінії визначеної довжини і орієнтації.

3)                         Синтаксичні, елементами яких є алфавіт символів або об'єктів. Зображення синтезується по визначених правилах із цих компонентів.

2.9.3.                        Сприйняття двовимірних і трьохвимірних зображень

Для попередньої обробки 2-х вимірних зображень використовуються

Наступні методи:

1)          Зміна загальної або локальної яскравості зображення і його контрастності;

2)           Підкреслення границь на основі переходів яскравості;

3)           Зменшення шумів і завад на основі різних видів фільтрації;

4)           Кореляція геометричних спотворень зображень на основі зміни масштабу.

Вторинна обробка залежить від задач, що вирішуються. Візуальне сприйняття 3-х вимірних схем здійснюється як одним оком (монокулярна) так і двома очима (бікулярна).

Монокулярний зір характеризується наступними особливостями:

1)          Лінійна перспектива;

2)           Тіні, напівтони і т.д.;

3)           Маскування - закриття одними предметами інших;

4)           Огляд об'єкту з різних сторін;

5)           Візуальна пам'ять;

6)           Відчуття різновидності в напруженні м'яз ока.

Всі ці особливості створюють ефект глибини при монокулярному зорі. При бікулярному зорі основну роль відіграє очний базис. Із-за того, що очі людини дивляться на об'єкт з різних позицій, зображення одного і того ж об'єкту для кожного ока будуть відрізнитися. Різниця лівого і правого зображення враховується в великих півкулях кори головного мозку, в результаті чого створюється відчуття трьохвимірності.

2.9.4. Система обробки і аналізу візуальної інформації.

Ці системи орієнтовані на вирішення наступних задач:

1)                                   Обробка зображень, коли початкові дані і результати обробки представляються в формі зображення . В якості прикладу можуть служити усунення спотворень або дефектів на зображені, покращення якості візуальної інформації шляхом підвищення контрасту або підкреслення контурів.

2)                                 Аналіз, що включає інтерпретацію розпізнавання зображень, коли вхідними даними є зображення, а результати представляються в текстові формі.

До типових задач аналізу можна віднести:

•           Розпізнавання рукописних текстів;

•           Дешифрування аерофотознімків і т.д.

Синтез зображень, коли на вході є опис зображення, а на виході по ньому будується зображення.

Системи обробки зображень можна розділяти на 3 групи:

1)                            Автоматизовані системи обробки зображень: обробка результатів дистанційних досліджень в геології, сільському господарстві, лісовому господарстві, аналіз стану навколишнього середовища, слідкування за об'єктами і т.д.

2)                        Система аналізу зображень. Обробка біомедичних даних (мікробіологія, ренгеноскопія, ультразвукоскопія і т.д.).

3)                           Комп'ютерна графіка. Автоматизація проектування, дизайнерські роботи, картографія і т.д.

2.10. Системи підтримки прийняття рішень (сппр)

2.10.1. Сутність і компоненти сппр

Сппр виникли на початку 70-х років завдяки подальшому розвитку управлінських інформаційних систем і є системи, розроблені для підтримки процесів прийняття рішень менеджерами в складних і слабоструктурованих ситуаціях, зв'язаних з розробкою і прийняттям рішень. На розвиток сппр істотний вплив справили вражаючі досягнення в галузі інформаційних технологій, зокрема телекомунікаційні мережі, персональні комп'ютери, динамічні електронні таблиці, експертні системи. Термін сппр (dss-decision support system) виник у 70-х роках і належить горрі та мортону, хоча перше покоління сппр мало чим відрізнялось від традиційних управлінських інформаційних систем, і тому замість сппр часто використовувався термін «системи управлінських рішень». І досі немає єдиного визначення сппр. Наприклад, деякі автори під сппр розуміють «інтерактивну прикладну систему, яка забезпечує кінцевим користувачам, які приймають рішення, легкий і зручний доступ до даних і моделей з метою прийняття рішень в напівструктурованих і неструктурованих ситуаціях з різних галузей людської діяльності». Відомі й інші означення, зокрема: «сппр — такий, що грунтується на використанні моделей, ряд і процедур з обробки даних , що допомагають керівникові в прийнятті рішень»; «сппр — інтерактивні автоматизовані системи, які допомагають особам, які приймають рішення, використовувати дані і моделі, щоб вирішувати неструктуровані і слабоструктуровані проблеми»; «сппр — комп'ютерна інформаційна система, використовувана для підтримки різних видів діяльності при прийнятті рішень в ситуаціях, де неможливо або небажано мати автоматичну систему, яка повністю виконує увесь процес рішень».

Але практично всі види цих комп'ютерних систем характеризуються чіткою родовою структурою» яка містить, три головні компоненти: підсистему інтерфейсу користувача; підсистему управління базою даних і підсистему управлінця базою моделей. Слід відмітити важливі концепції побудови інформаційних систем: інтерактивність, інтегрованість, потужність, доступність, гнучкість, надійність, робастність, керованість.

Інтерактивність сппр означає, що система відгукується на різного роду дії, якими людина має намір вплинути на обчислювальний процес; зокрема при діалоговому режимі. Людина і система обмінюються інформацією в темпі, який порівнянний з темпом обробки інформації людиною. Проте практика показує, що дуже мало керівників і бажають і вміють вести прямий діалог з комп'ютером. Багато з них віддають перевагу взаємодії із системою через посередника або в режимі непрямого доступу, де можлива пакетна обробка інформації. Водночас властивість інтерактивності необхідна при дослідженні нових проблем і ситуацій, при адаптивному проектуванні прикладних сппр.

Інтегрованість сппр забезпечує сумісність складових системи щодо управління даними і засобами спілкування з користувачами в процесі підтримки прийняття рішень.

Потужність сппр означає спроможність системи відповідати на найістотніші запитання.

Доступність сппр — це здатність забезпечувати видачу відповідей на запити користувача в потрібній формі і в необхідний час.

Гнучкість сппр характеризує можливість системи адаптуватися до змін потреб і ситуацій.

Надійність сппр полягає в здатності системи виконувати потрібні функції протягом заданого періоду часу.

Робастність (robustness) сппр — це ступінь здатності системи відновлюватися в разі виникнення помилкових ситуацій як зовнішнього, так і внутрішнього походження. Наприклад, в робастній системі допускаються помилки у вхідній інформації або несправності апаратних засобів. Хоча між надійністю і робастністю може існувати певний зв'язок, ці дві характеристики системи різні: система, яка ніколи не поновлюватиметься при виконанні помилкових ситуацій, може бути надійною, не будучи робастною; система з високим рівнем робастності, яка може відновлюватися і продовжувати роботу при багатьох помилкових ситуаціях, може бути водночас віднесена до ненадійних, оскільки вена не здатна заздалегідь, до пошкодження виконати необхідні службові процедури.

Керованість сппр означає спроможність з боку користувача контролювати дії системи і втручатися в хід розв'язування задачі.

Аналіз еволюції систем підтримки прийняття рішень дає змогу вирізнити два покоління сппр: перше покоління розроблялося в період з 1970 до 1980 р., друге -- з початку 1980 р. І досі (розробка триває).

Перше покоління сппр, як уже зазначалося, майже повністю повторювало функції звичайних управлінських систем щодо надання комп'ютеризованої допомоги в прийнятті рішень. Основні компоненти сппр мали такі ознаки:

Управління даними — велика кількість інформації, внутрішні і зовнішні банки даних, обробка й оцінювання даних;

Управління обчисленнями (моделювання) — моделі, розроблені спеціалістами в галузі інформатики для спеціальних проблем;

Користувацький інтерфейс (мова спілкування) — мови програмування) створені для великих еом, які використовуються виключно програмістами.

Сппр другого покоління уже мають принципово нові ознаки: управління даними — необхідна і достатня кількість інформації про факти згідно зі сприйняттям опр, що охоплює приховані припущення, інтереси та якісні оцінки;

Управління обчисленням і моделюванням — гнучкі моделі, які відтворюють спосіб мислення опр у процесі прийняття рішень;

Користувацький інтерфейс — програмні засоби, «дружні» користувачеві, звичайна мова, безпосередня робота кінцевого користувача.

Мету і призначення сппр другого покоління можна визначити так:

Допомога в розумінні розв'язуваної проблеми. Сюди належать структуризація проблеми, генерування постановок задач, виявлення переваг, формування критеріїв:

Допомога в розв'язуванні задачі: генерування і вибір моделей та методів, збір і підготовка даних, виконання обчислень, оформлення і видача результатів;

Допомога аналізу розв'язків, тобто проведення аналізу типу «що ... Коли ...?» і та .ін., пояснення ходу розв'язування, пошуки видача аналогічних рішень у минулому та їх наслідків.

Дружні людині сппр дають їй змогу вести рівноправний діалог з пеом, використовуючи звичні мови спілкування. Системі можуть «персоналізувати» користувача, підстроюватися під його стиль мислення, рівень знань і професійної підготовки, а також засоби роботи.

2.10.2. Сфери застосування та приклади використання сппр

Системи підтримки прийняття рішень набули широкого застосування в економіках передових країн світу, причому їхня кількість постійно зростає. На рівні стратегічного управління використовується ряд сппр, зокрема для довго­, середньо- і короткострокового, а також для фінансового планування, включаючи систему для розподілу капіталовкладень. Орієнтовані на операційне управління сппр застосовуються в галузях маркетингу (прогнозування та аналіз збуту, дослідження ринку і цін), науково-дослідних та конструкторських робіт, в управлінні кадрами. Операційно-інформаційні застосування пов'язані з виробництвом, придбанням та обліком товарно-матеріальних запасів, їх фізичним розподілом та бухгалтерським обліком.

Узагальнені сппр можуть поєднувати дві чи більше з перелічених функцій. У сша 1984 року було проаналізовано 131 тип сппр і завдяки цьому виявлено пріоритетні галузі використання систем. До них належать такі: виробничий сектор; гірничорудна справа; будівництво; транспорт; фінанси;

Урядова діяльність.

Комп'ютерна підтримка різних функцій за допомогою сппр має такий розподіл:

Операційне керування —30%; довгострокове планування — 40 %; розподіл ресурсів — 15 %; розрахунки річного бюджету — 12 %.

Перелік найвідоміших «комерційних» сппр містить сотні назв. Наведено ряд найбільш типових сппр, які стосуються проблем мікро- та макроекономіки:       а

«симплан» — призначена для корпоративного планування

«прожектор» — фінансового планування;

«джіплан» — загального планування;

«експрес» —маркетингу, фінансів;

Рм8 — керування цінними паперами;

Сі8 — планування виробів;

Рім8 — маркетингу;

Ві8 — керування бюджетом;

Ібр8 — інтерактивного фінансового планування;

Босш — фінансового моделювання;

18э8 — формування «портфеля замовлень»;

Маиэ—індивідуального вибору,

2.10.3. Архітектура систем підтримки прийняття рішень

Архітектура сппр складається з трьох основних підсистем (рисунок .

2.17):

Інтерфейсу користувача, який дає змогу особі, що приймає рішення (опр), провадити діалог із системою, використовуючи різні програми вводу, формати і технології виводу;

Підсистеми, призначеної для зберігання) керування, вибору, відображення та аналізу даних;

Підсистеми, яка містить набір моделей для забезпечення відповідей на множину запитів користувачів, для розв'язування задач, аналізу чутливості та інших аналітичних задач.

Ч

База даних

База моделей

І субд 1

Рисунок 2.17.компоненти сппр

Інтерфейс користувач—система

Комп'ютерні системи підтримки прийняття рішень призначені розв'язувати задачі для користувачів, а тому невіддільною складовою їхньої роботи має бути точне використання параметрів, здобутих від користувача, і повернення йому результатів роботи системи. При цьому якщо система працює коректно, але подає результати у спосіб, який є незручним для користувача, то роботу такої системи не можна вважаю-задовільною (людському фактору при створенні сппр приділяється основна увага). Загальне побажання користувачів полягає в тому, щоб зі складними інформаційними системами можна було працювати успішно, минаючі довгочасний і дорогий етап навчання. Усе це зумовлює ряд вимог та особливостей побудови користувацького інтерфейсу сппр.

Інтерфейс користувач—система забезпечує зв'язок опр із сппр та її компонентами. При проектуванні й розробці інтерфейсу необхідно додержувати певного еталона, який має три ключові аспекти:

Мову дій — що може робити користувач під час спілкування з сппр. Мова дій охоплює операції від звичайного користування клавіатурою чи функціональними клавішами та сенсорними панелями до джойстику і усних команд звичайною мовою;

Мову відображення — що бачить користувач у результаті роботи системи. Варіанти вибору щодо мови відображення досить різноманітні: використання графічних засобів; кольору, графобудувачів, звукового виводу тощо;

Базу знань — що необхідно знати користувачеві, щоб вести діалог із системою. Бази. Знань може знати користувач чи вона може міститися на папері (як посібник) і бути доступною як сукупність діалогових команд підказування (із застосуванням навчальних засобів) чи деяка комбінація перелічених компонентів.

База даних і система управління базою даних

Будь-яка система підтримки прийняття рішень містить підсистему даних, яка складається з двох основних частин: бази даних і системи управління базою даних (субд). Притаманний технології сппр акцент на обробку неструктурованих і слабоструктурованих задач зумовлює деякі специфічні вимоги до цих елементів комп'ютерної системи. Насамперед йдеться про необхідність виконувати значний обсяг операцій переструктурування даних. Потрібно передбачити можливість завантаження і наступної обробки даних із зовнішніх джерел; функціонування субд у середовищі сппр на відміну від звичайної обробки інформації в управлінських інформаційних системах потребує ширшого набору функцій. Це стосується також і бази даних.

Загалом базу даних можна визначити як сукупність елементів, організованих згідно з певними правилами, які передбачають загальні принципи опису, зберігання і маніпулювання даними незалежно від прикладних програм. Зв'язок кінцевих користувачів (прикладних програм) з базою даних відбувається з допомогою субд. Остання являє собою систему програмного забезпечення, яка містить засоби обробки мовами баз даних і забезпечує створення бази даних та її цілісність, підтримує її в актуальному стані, дає змогу маніпулювати даними і обробляти звернення до бд, які надходять від прикладних програм і (або) кінцевих користувачів за умов застосовуваної технології обробки інформації. До складу мов бази даних, які використовуються для вивчення і звертання до даних, належить мова опису даних (мод) і мова маніпулювання даними (ммд).

Мова опису даних призначена для визначення структури бази даних. Опис даних заданої проблемної області може виконуватися на кількох рівнях абстрагування, причому на кожному рівні використовується своя мод. Опис на будь-якому рівні називається схемою. Найчастіше використовується трирівнева система: концептуальний, логічний і фізичний рівні. На концептуальному рівні описуються взаємозв'язки між системами даних, що відповідають реально діючим залежностям між факторами та параметрами проблемного середовища. Структура даних на концептуальному рівні називається концептуальною схемою. На логічному рівні вибрані взаємозв'язки відбиваються в структурі записів бази даних. На фізичному рівні розв'язуються питання організації розміщення структури запису на фізичних носіях інформації.

Мова маніпулювання даними забезпечує доступ до даних і містить засоби для зберігання, пошуку, оновлення і стирання записів. Мови маніпулювання даними, які можуть використовуватися кінцевими користувачами в діалоговому режимі, часто називають мовами запитів.

Бази даних і субд використовуються в будь-яких комп'ютерних системах. Проте порівняно зі звичайними підходами до реалізації бази даних для розв'язування деяких задач до функцій та інтрументів бд і субд у контексті системи підтримки прийняття рішень висувається ряд додаткових і спеціалізованих вимог.

Для умов використання сппр існує необхідність доступу інформації зі значно ширшого діапазону джерел, аніж це передбачено в звичайних інформаційних системах. Інформацію потрібно діставати від зовнішнього середовища і внутрішніх джерел; потреба в зовнішніх даних тим більша, чим виший рівень керівництва, яке обслуговує вибране сппр. Окрім того, звичайні, орієнтовані на бухгалтерський облік дані (характерні для систем обробки даних і адміністративних інформаційних систем) необхідно доповнити нетрадиційними типами даних, зокрема й такими, які досі взагалі не були у фокусі комп'ютеризації. Сюди належать: текстова інформація, матеріал систем автоматизованого проектування виробів і технологій, автоматизованого виробництва, а також інші джерела інформації, необхідні для прийняття рішення.

База моделей і система управління базою моделей.

Протягом 60-х років управлінські системи розроблялися на базі процедурних елементів, причому управління моделями полягало в керуванні бібліотеками процедур розв'язків, поданих у формі програм і підпрограм. На початку 70-х років набула стабільності концепція баз даних, на основі якої і створювались інформаційні системи. Проте тепер визнаною є думка, що саме моделі визначають відношення між даними і суто базовий підхід проектування систем приводить до нехтування зв'язків, які відповідають процесам і процедурам у середовищі розв'язуваних задач. Тому спостерігається міграція від підходу даних до підходу моделей, що стають джерелом тверджень і засновків як підґрунтя для усвідомлення суті інформаційних відношень. Концепція управління моделями усвідомлюється дедалі ширшим загалом спеціалістів як передній край у галузі інформаційних систем і систем підтримки прийняття рішень,

Система управління моделями є одним із компонентів архітектури універсальної сппр. Функціями цього компонента є класифікація, організація і доступ до моделей, тобто ці функції аналогічні функціям системи управління базами даних.

База моделей сппр містить оптимізаційні і неоптимізаційн моделі. До складу оптимізаційних моделей належать моделі математичного програмування — лінійного (розподіл ресурсів, оптимальне планування, аналіз сіткових графіків, транспортна задача) нелінійного, динамічного; моделі обліку; моделі аналізу цінних паперів для визначення інвестиційної стратегії; моделі маркетингу та .ін.

До неоптимізаційних моделей належать статистичні моделі (лінійний і нелінійний аналіз регресій); методи прогнозування (аналізу) часового ряду; альтернативні методи моделювання (наприклад, машинна імітація) тощо.

У більшості відомих з літературних джерел систем для маніпулювання і зберігання моделей використовувались поняття і методи подання знань (формальна логіка, моделі продукції, семантичні мережі, фрейми та їхні гібриди), а також реляційні бази аналогічні реляційні моделі даних.

Системи управління базами моделей (субм), як узагальнені програмні.засоби, забезпечують користувачам широкий набір моделей і дають змогу проводити гнучкий доступ, оновлення та зміну бази моделей.

Основні функції субм такі: створення нових моделей;

Каталогізація і оцінка широкого діапазону моделей; зв'язування компонентів моделей у базі моделей; інтеграція складових елементів моделей; виконання набору загальних функцій управління субм.

Програмне забезпечення для субм розроблене значно менше, ніж для субд чи користувацького інтерфейсу; наявним системам субм притаманне розмаїття, а комерційні пакети сппр нерідко містять основні комбінації аналітичних методів розв'язування, статистичних пакетів та інших засобів моделювання. Повний комплект усіх сімей і підсімей методів моделювання зустрічається рідко, а частіше вмонтовані в систему процедури і засоби користувацького інтерфейсу; субм для систематизованого формулювання, аналізу та інтерпретації моделей часто бувають спрощеними і обмеженими за своєю природою. Перспективним напрямком створення ефективних субм є структурне моделювання. Розроблено також кілька мов програмування досить високого рівня, спеціально пристосованих для створення елементів субм для сппр.

2.11. Штучні нейронні мережі

Дослідження у сфері штучних нейронних мереж (нм) пережили три періоди активізації. Перший пік у 40-их роках був зумовлений піонерською роботою маккалока і пітса. Другий виник у 60-их роках завдяки теоремі сходження персептрона розенблата і роботі мінського та пейперта, які вказали обмежені можливості найпростішого персептрона. Через дослідження мінського і пейперта зник ентузіазм у більшості дослідників, особливо тих, хто працював у галузі обчислювальних наук. Затишшя у сфері нм тривало майже 20 років. З початку 80-их років штучні нм знову привернули увагу дослідників. Це було пов'язано з енергетичним підходом хопфілда та алгоритмом зворотнього поширення помилки для навчання багаторівневого персептрона (багаторівневі мережі прямого поширення), що вперше запропонував вербос і незалежно розробили інші автори.

Серед головних проблем, які вирішують за допомогою штучних нм і які цікавлять вчених та інженерів, можна визначити такі:

•           Класифікація образів: мета задачі - вказати приналежність вхідного образу (наприклад, речового сигналу або рукописного символу), поданого як вектор ознак, до одного або декількох завчасно визначених класів. До таких застосувань належать розпізнавання букв, мови, класифікація сигналу електрокардіограми, кліток крові тощо;

•           Кластеризація / категоризація: при розв язані задач кластеризаци, знаної як класифікація образів «без вчителя», відсутня навчальна вибірка з позначками класів. Алгоритм кластеризації будують на основі образів і розміщають подібні образи в один кластер. Відомі випадки застосування кластеризації для здобуття знань, стиснення даних і дослідження їх властивостей;

•           Апроксимація функцій: припустимо, що існує вибірка ((х11), (х22)..., (хпп)) (пари даних вхід-вихід), що генерується відомою функцією б(х), котра спотворюється через шум. Задача апроксимації зводиться до находження оцінки невідомої функції бп(х). Апроксимація функцій необхідна при розв'язанні численних інженерних задач моделювання;

•           Передбачення / прогноз: нехай задані п дискретних точок (у(11), у(1і2)..., у(д} у послідовні проміжки часу 11, 1і2..., 1іп.. У задачі потрібно передбачити значення у(1п+1) у певний майбутній момент часу 1п+1. Передбачення / прогноз має значний вплив на прийняття рішень у бізнесі, науці та техніці. Передбачення цін на фондовій біржі та прогноз погоди - це типові застосування технології передбачення / прогнозу;

•            Оптимізація: численні проблеми в математиці, статистиці, техніці, науці, медицині й економіці можна розглядати як проблеми оптимізації. Задача алгоритма оптимізації - находження такого рішення, яке задовольняє систему обмежень і максимізує або мінімізує цільову функцію. Задача комівояжера з класу кр-повних - це класичний приклад задачі оптимізації;

•            Асоціативна пам'ять: у моделі розрахунків фон неймана звернення до пам'яті можливе лише за допомогою адреси, що не залежить від змісту пам'яті. Крім того, якщо допущена помилка в розрахунку адреси, то можна знайти зовсім іншу інформацію. Асоціативна пам'ять (пам'ять, що адресується за змістом) доступна після визначення заданого змісту. Вміст пам'яті можна викликати навіть у результаті часткового входження або за спотвореним змістом. Асоціативна пам'ять надзвичайно важлива при створенні мультимедійних інформаційних баз даних;

•           Управління: розглянемо динамічну систему, задану сукупністю {и(1і), у(1)}, де и(1і) - вхідний керуючий вплив, а у(1і) - вихід системи в момент часу 1. У системах управління з еталонною моделлю головна мета управління - це розрахунок такого вхідного впливу и(1), при якому система прямує по бажаній траєкторії, яку диктує еталонна модель. Прикладом є оптимальне управління двигуном.

2.11.1. Модель однорівневого перcептрона

У моделі однорівневого персептрона (рисунок 2.18) вхідні сигнали бінарні або аналогові (дійсні). Розмірності входу та виходу обмежені при програмній реалізації лише можливостями обчислювальної системи, на якій моделюється нм, при апаратній реалізації - технологічними можливостями. Модель однорівневого персептрона застосовують переважно для розпізнавання образів і класифікації. Недоліками моделі можна вважати примітивні розділяючі поверхні (гіперплощини), які дають змогу, з одного боку, розв'язувати лише найпростіші задачі розпізнавання. Однак, з іншого боку, програмні чи апаратні реалізації моделі однорівневого персептрона дуже прості, простий і швидкий алгоритм навчання.

Х

Х

Х

Б

Х

Х

Х

А

 

Рисунок. 2.18. Структура нм: а - однорівневий персептрон; б - багаторівневий персептрон.

Для однорівневого персептрона з п входами вихідне значення

 

У = ї ^ - т

І=1

Де wi1 - вагові коефіцієнти входів лінійного нейронного елемента, х і - вхідні дані, т - поріг нейрона. Для навчання однорівневого персептрона використовують правило відроу-хофа, що базується на методі градієнтного спуску в просторі вагових коефіцієнтів і порогів нм. Згідно з цим правилом необхідно здійснити мінімізацію середньоквадратичної помилки:

Ь                    і ь

Е = 1е(к) = 1x (у* - )2                                                                            (2 2),

Де (к) дwn(t)

(2.3),

Wil(t +1) = wil(t) -а

К=і 2 к=і

Де ь - множина вхідних навчальних векторів, е(к) - середньоквадратична

(2.1),

Помилка мережі для к -го вхідного вектора, укк - вихідне та еталонне значення нм для к -го вхідного вектора відповідно. Зміну вагових коефіцієнтів і порогів нейронної мережі можна знайти за такими формулами:

Т (ґ +1) = т (ґ) - а дек)                                                                  (2.4),

Дт (ґ)

Де і = 1, п, wiі +1), wi1(і) - вагові коефіцієнти в моменти часу і +1 і і

• * де (к)

Відповідно, а- швидкість або крок навчання, -----------------  - похідна середньо-

^іі)

Квадратичної помилки е(к) за параметром wi1, wi 1(і +1), wi 1(і) - пороги

Де(к)

Неиронної мережі в моменти часу і +1 і і, ^ - похідна середньо-

Квадратичної помилки е(к) по параметру т.

Визначивши похідні середньоквадратичної помилки (2.3 - 2.4) за відповідними змінними, можна отримати кінцеві вирази для зміни вагових коефіцієнтів і порогів:

Ґ + 1) = ґ) -а(ук - йк)х*                                                                  (2.5),

Т(ґ +1) = т(ґ) + а(ук - йк)                                                                  (2.6),

Де і = 1, п, х і - і-та компонента к -го вхідного вектора.

Правило відроу-хофа виконують за наступною послідовністю кроків.

1.       Задати швидкість навчання а (0 < а < 1) і мінімальну середньоквадратичну помилку мережі етіп, яку необхідно досягти в процесі навчання.

2.       Вагові коефіцієнти та поріг нм ініціювати випадково.

3.       На вхід нейронної мережі подати вхідні дані, вихід нм обчислити згідно з формулою 1.1.

4.       Змінити значення вагових коефіцієнтів і порога нм за виразами 2.5-2.6.

5.       Виконувати кроки 3-4 доти, поки сумарна середньоквадратична помилка мережі (1.2) не буде меншою від заданої, тобто е £ етіп .

При використанні правила навчання відроу-хофа виникає проблема вибору значення кроку навчання а, тобто його потрібно правильно вибрати для забезпечення сходження алгоритму навчання. Для прискорення процедури навчання градієнтного спуску однорівневого персептрона в. А. Головко запропонував використати адаптивний крок навчання:

1 + £ (і у

І=1

Експериментальні дослідження використання адаптивного кроку навчання однорівневого персептрону підтверджують, що при його використанні процес навчання відбувається приблизно в три рази швидше, ніж при використанні постійного кроку. Це дало змогу застосувати адаптивний крок навчання (2.7) при обчисленні зміни вагових коефіцієнтів і порогів нм (2.5-2.6).

2.11.2. Модель багаторівневого персептрона

Багаторівневі персептрони запропонували і вивчили в 1960-их роках розенблат, мінський

Зацікавило?

Змiст

Нові надходження

Всього підручників:

292