ИННОВАЦИИ РОСИИ: МЕТА-МОДЕЛИ ПРЕДСТАВЛЕНИЯ данных общефизических процессов и их применение
На модерации
Отложенный
Все началось в далеком 1981 году, когда я разрабатывал Систему анализа дефектов для производства танковых газотурбинных двигателей (детище Устинова). Использование традиционной дискретной(РЕЗАННОЙ НА ПРИЗНАКИ) модели прямого семантического структурирования и кодирования текстов не давала удовлетворительных результатов. Данные не поддавались полной и детальной систематизации.
Тогда я понял главное: неисправность с точки зрения общефизического представления это НЕПРЕРЫВНЫЙ ПРИЧИННО - СЛЕДСТВЕННЫЙ ФИЗИЧЕСКИЙ ПРОЦЕСС (Процесс развития дефекта), а данные (тексты…,параметры, зависимости, графики…)только отражают наши знания об этом процессе.
Следовательно, данные связаны между собой через структурную мета модель общефизических представлений о неисправности.
В дальнейшем этот вывод и следствие был обобщен на другие группы физических процессов (производство, функционирование изделий, физические и медико-биологические процессы)
За дальнейшие 11 лет были разработаны для предметной области «Техника»:
-Канонические концептуальные мета модели для полностью программно доступного представления данных;
-Тезаурус массивов элементов данных (семантически неделимые данные) и терминов предметной области «Техника»(Стартовая версия<50 Мб, готовность 80%) ;
-Алгоритмы структурного интерактивного семантического автокодирования текстовых данных и ведения массивов Тезауруса (готовность100%).
Какие преимущества подхода:
Таким образом, все многообразие текстовой информации поддерживают два инварианта: небольшой по современным меркам Тезаурус и набор структурных канонических моделей.
Почему тезаурус небольшой?: Потому что большую основу его составляют неделимые, но связанные между собой кодировкой по смыслу слова(data item), а число этих данных на порядки меньше возможных комбинаций. Аналогия: Изобретение фонетической азбуки финикийцами для написания всего многообразия слов.
Напрашивается вопрос: Открыл «Америку». Ну кто не знает что физические процессы идут в развитии с причинно- следственными связями, на этом же построено их изучение(т.е. формирование текстов).
ОТВЕТ: Существует масса программ структурированного семантического представления текстов. Но все они гуляют в потемках и поэтому режут по живому на дискретные куски тексты связанные семантически моделью общефизического представления.
Догадаться о том что можно, а главное реально возможно сконструировать абстрактные мета структурные модели представлений данных о физических процессах для различных предметных областей, создать компактный массив неделимых связанных смыслов (Тезаурус) и семантически автоматически разбивая на неделимые , но связанные по смыслу элементы нанизывать на эту структуру текстовые данные не смог пока никто.За этой технологией будущее IT.
Аналогия из техники: Все наблюдали катящиеся камни и бревна, но как их оседлать, чтобы создать колесный движитель? Но только один смог создать натурную модель плоскопараллельного движения (качения колеса), а затем сконструировать неподвижную относительно центра колеса ось с подшипником скольжения.
Как работает система: Текст интерактивно заводится сканированием документа (таблицы) либо вводится оператором через речевой процессор. Обращение на выборку и обработку производится текстом (который авто кодируется) либо внутренними текстами классификации штатной системы (при этом текст классификатора авто кодируется в набор кодов ТЕЗАУРУСА).
Где можно применять систему семантического автокодирования текстов:
1.Уже сейчас есть потребность: ИННОВАЦИОНННЫЙ МОДУЛЬ-РАСШИРЕНИЕ Систем Технического обслуживания и ремонта(ТОиР) оборудования крупных компаний(EAM, ERP системы);
2.Системы автоматического проектирования (CAD),экспертных системы и базы знаний (в том числе ИНТЕЛЕКТ-ОБОЛОЧЕК проектирования диагностических систем в технике и медицине);
3.Интернет-интелект поиск и обработка данных по технической и научной тематике;
4.Самообновляющаяся Федеральная связанная классификация оборудования, технологий, и их дефектов для Технадзора, МЧС.
3. Возможно использование подхода в гуманитарной сфере (Обучение персонала, синтез сценариев фильмов, расследование преступлений, интеллект обработка текстов в делах преступников…).
Комментарии