Генеративная извлекаемая информация с использованием больших языковых моделей

Открытое исследование, проведенное Университет Строительства и Технологии Китая, Государственной ключевой лабораторией познавательного интеллекта, Городским университетом Гонконга и Центром исследований Джарвиса, касается нового подхода к генеративному извлечению информации (IE) с использованием больших языковых моделей (LLM). Вместо использования традиционных методов структурированного извлечения знаний из неструктурированного текста, этот новый подход использует LLM для генерации структурной информации, продемонстрировав его потенциал в реальных приложениях.

Исследователи используют две таксономии для классификации существующих методов генеративного IE: одну, сфокусированную на парадигмах обучения, и другую — на подзадачах IE. Используя эти таксономии, исследование ранжирует LLM для IE на основе их производительности в конкретных областях. Оценка также предлагает понимание ограничений и будущих возможностей использования LLM в генеративном IE.

Исследование представляет четыре стратегии рассуждения о распознавании именованных сущностей (NER), которые воспроизводят возможности ChatGPT в нулевом NER. В то время как LLM обещают в Relation Extraction (RE), требуется дальнейшее исследование для повышения их производительности в задачах Event Extraction (EE) из-за сложности инструкций и недостаточной устойчивости. Кроме того, исследование оценивает различные подзадачи IE и показывает, что LLM преуспевают в определенных средах, таких как OpenIE, но уступают моделям на основе BERT в обычных настройках IE.

В то время как предыдущие подходы к генеративному IE были предметно или задачно-специализированными, интеграция LLM представляет возможность для более объединенных техник. Однако по-прежнему существуют сложности, такие как выравнивание расширенного контекста ввода и структурированного вывода. Исследователи рекомендуют дальнейшее изучение контекстного обучения в LLM, подчеркивая важность выбора примеров и разработки универсальных рамок IE, адаптируемых к различным областям и действиям.

Исследование также подчеркивает важность усовершенствования подсказок для улучшения понимания и рассуждений LLM. Это включает в себя наталкивание LLM на логические заключения и создание объяснимого вывода. Интерактивное проектирование подсказок, включающее многоходовые схемы вопрос-ответ, является еще одним направлением для академического исследования.

В заключение, это выдающееся исследование демонстрирует потенциал генеративного IE с использованием LLM, предоставляя ценные понимания их производительности, ограничений и будущих направлений. Дальнейшее развитие LLM-основанного IE может значительно внести вклад в область обработки естественного языка.

The source of the article is from the blog portaldoriograndense.com