Skip to main content
FHEDEEN
Infomaterial anfordern

Bachelor Flyer Master Flyer

Kontakt

Sekretariat Angewandte Informatik
Tel.: 0361 / 6700-5510 sekretariat-ai@fh-erfurt.de

Besucheranschrift:

Fachhochschule Erfurt
Fakultät Gebäudetechnik und Informatik
Fachrichtung Angewandte Informatik
Altonaer Straße 25
99085 Erfurt

Hypothesenbildung bei natürlichen Sprachen anhand einer kontextfreien Grammatik

In dem Projekt, geht es darum, eine kontextfreie Grammatik für Aufforderungs- und Fragesätze in der deutschen Sprache zu erstellen. Es werden Satzstrukturen angelegt und mit Kontexten versehen. Anschließend werden mittels eines SLR-Parsers Sätze gegen die Grammatik getestet. Der SLR-Parser ist in C++ umgesetzt. Dazu wird ein Automat und eine Parsetabelle für den Parser erzeugt. Bei dem SLR-Parser handelt es sich um einen LR-Parser. Diese sind bottom-up Parser und werden meist für Computersprachen benutzt. Beim erfolgreichen Parsen entsteht ein Syntaxbaum. Dieser zeigt die Satzstruktur und den Kontext des Satzes. Werden Sätze geprüft und nicht erkannt, soll das Programm Hypothesen erstellen, mit Hilfe derer der neue Satz parsebar wird. Es werden Konzepte aus dem Case-Based-Reasoning benutzt, um Hypothesen für nicht parsebare Eingaben zu erzeugen. Dazu kommt eine Brute-Force-Methode, um unbekannte Wörter in bekannten Satzstrukturen unterzubringen. Auch hier werden nur Hypothesen erzeugt. Bestätigt der Nutzer diese, dann werden neue Grammatikregel generiert und in der Grammatik abgespeichert. Die Falldatenbank des Case-Based-Reasoning wird ebenfalls mit jedem gelösten Fall erweitert.

The aim of the project is to create a context-free grammar for phrases and interrogative sentences in the German language. Sentence structures are created and provided with contexts. Sentences are then tested against the grammar using an SLR parser. The SLR parser is implemented in C++. An Abstract machine and a parsing table for the parser are created for this purpose. The SLR parser is an LR parser. These are bottom-up parsers and are mostly used for computer languages. Successful parsing produces a syntax tree. This shows the sentence structure and the context of the sentence. If sentences are checked and not recognised, the program should create hypotheses with the help of which the new sentence is parsable. Case-based reasoning Concepts are used to generate hypotheses for non-parsable inputs. In addition, a brute force method is used to place unknown words in known sentence structures. Here too, only hypotheses are generated. If the user confirms these, new grammar rules are generated and saved in the grammar. The case database for case-based reasoning is also expanded with each solved case.

Zurück