ИННОВАЦИИ РОСИИ: МЕТА-МОДЕЛИ ПРЕДСТАВЛЕНИЯ данных общефизических процессов и их применение

На модерации Отложенный

 

Все началось в далеком 1981 году, когда я разрабатывал Систему анализа дефектов для производства танковых газотурбинных двигателей (детище Устинова). Использование традиционной дискретной(РЕЗАННОЙ НА ПРИЗНАКИ) модели прямого семантического структурирования  и кодирования текстов    не давала удовлетворительных результатов. Данные не поддавались полной и  детальной  систематизации.

Тогда я понял главное: неисправность с точки зрения общефизического представления это НЕПРЕРЫВНЫЙ ПРИЧИННО - СЛЕДСТВЕННЫЙ  ФИЗИЧЕСКИЙ ПРОЦЕСС (Процесс развития дефекта), а данные (тексты…,параметры, зависимости, графики…)только отражают наши знания об этом процессе.

 Следовательно, данные  связаны между собой через  структурную мета модель общефизических представлений о неисправности.

 В дальнейшем   этот вывод и следствие был обобщен на  другие группы физических процессов  (производство, функционирование изделий, физические и медико-биологические процессы)  

За дальнейшие 11 лет были разработаны для предметной области «Техника»:

-Канонические концептуальные мета модели для полностью программно доступного представления данных;

-Тезаурус массивов элементов данных (семантически неделимые данные) и терминов предметной области «Техника»(Стартовая версия<50 Мб, готовность 80%)  ;

-Алгоритмы структурного интерактивного семантического автокодирования текстовых данных и ведения массивов Тезауруса (готовность100%).

Какие преимущества подхода:

Таким образом, все многообразие текстовой информации поддерживают два инварианта: небольшой по современным меркам Тезаурус и набор структурных канонических моделей.

 

Почему тезаурус небольшой?: Потому что большую основу его составляют неделимые, но связанные между собой кодировкой по смыслу слова(data item), а число  этих данных  на порядки меньше возможных комбинаций. Аналогия: Изобретение фонетической азбуки финикийцами для написания всего многообразия слов.

Напрашивается вопрос: Открыл «Америку». Ну кто не знает что физические процессы идут в развитии с причинно- следственными связями, на этом же построено их изучение(т.е. формирование текстов).

ОТВЕТ: Существует масса программ  структурированного семантического представления текстов. Но все они гуляют в потемках и поэтому режут по живому на дискретные куски тексты связанные семантически моделью общефизического представления.

  

 Догадаться о том что можно, а главное реально возможно  сконструировать абстрактные мета структурные модели представлений данных о физических процессах для различных предметных областей, создать  компактный массив неделимых связанных смыслов (Тезаурус)  и семантически автоматически разбивая на неделимые  , но связанные по смыслу  элементы нанизывать  на эту структуру текстовые данные не смог пока никто.За этой технологией будущее IT. 

Аналогия из техники: Все наблюдали катящиеся камни и бревна, но как их оседлать, чтобы создать колесный движитель? Но только один смог создать натурную модель плоскопараллельного движения   (качения колеса), а затем сконструировать  неподвижную относительно центра колеса ось с подшипником скольжения.

 

Как работает система: Текст интерактивно заводится сканированием документа (таблицы) либо вводится оператором через  речевой процессор. Обращение на выборку и обработку производится текстом (который авто кодируется) либо  внутренними текстами  классификации штатной системы  (при этом текст классификатора авто кодируется в  набор кодов ТЕЗАУРУСА).                                                                                                           

 

Где  можно применять систему семантического автокодирования текстов:

 

1.Уже сейчас есть потребность: ИННОВАЦИОНННЫЙ МОДУЛЬ-РАСШИРЕНИЕ Систем Технического обслуживания и ремонта(ТОиР) оборудования крупных компаний(EAM, ERP системы);

2.Системы автоматического проектирования (CAD),экспертных системы и базы знаний (в том числе ИНТЕЛЕКТ-ОБОЛОЧЕК проектирования диагностических систем в технике и медицине);

3.Интернет-интелект  поиск и обработка данных по технической и научной тематике;

4.Самообновляющаяся Федеральная связанная  классификация оборудования, технологий, и их дефектов для Технадзора, МЧС.  

3. Возможно использование подхода в гуманитарной сфере (Обучение персонала, синтез сценариев фильмов, расследование преступлений, интеллект обработка текстов  в делах преступников…).