Kursen skall ge en översikt över området textgenerering och dess olika tillämpningsområden.
Enligt Reiter&Dale:
Enligt McKeown:
Enligt Reiter&Dale:
med mellanrepresentationerna textplan och meningsplan som i bilden nedan:
GOAL | V ___________ | TEXT | | PLANNER | |__________| | V TEXT PLAN | V ___________ | SENTENCE | | PLANNER | |__________| | V SENTENCE PLAN | V _____________ | LINGUISTIC | | REALISER | |____________| | V SURFACE TEXT
Enligt amazon.com:
This book explains how to build Natural Language Generation (NLG) systems--computer software systems which automatically generate understandable texts in English or other human languages. NLG systems use knowledge about language and the application domain to automatically produce documents, reports, explanations, help messages, and other kinds of texts. The book covers the algorithms and representations needed to perform the core tasks of document planning, microplanning, and surface realization, using a case study to show how these components fit together.It is essential reading for researchers interested in NLP, AI, and HCI; and for developers interested in advanced document-creation technology.
Tidigare artikel från 1997 som behandlar ungefär detsamma som boken, men mer översiktligt, samt dior från tutorial finns på http://www.csd.abdn.ac.uk/~ereiter/book.html
Hardcover (January 1991)
Kluwer Academic Publishers; ISBN: 0792390989
Enligt amazon.com:
THIS TITLE IS CURRENTLY NOT AVAILABLE. The publisher is out of stock. If you would like to purchase this title, we recommend that you occasionally check this page to see if it's been reprinted.
Enligt amazon.com:
Editorial Reviews
From Book News, Inc. , July 1, 1991
Researchers in the field present an overview of the state-of-the-art in natural language generation, describing both current research developments and directions for future research. All aspects of the generation process are discussed within the volume's three sections on text planning, lexical choice, and grammar. Suitable as a reference for researchers or as an advanced text for a course on the subject. Annotation copyright Book News, Inc. Portland, Or.
Hardcover (February 1993) Pinter Pub Ltd; ISBN: 1855670844
Paperback (June 1996) Springer Verlag; ISBN: 3540608001
Hardcover - (January 1999)
Enligt amazon.com:
Table of Contents
List of Figures.
List of Tables.
Preface.
1. Introduction.
2. Lexicalization in NLG.
3. Classifying Lexical Variation.
4. Modelling the Domain.
5. Levels of Representation: SITSPEC and SEMSPEC.
6. Representing the Meaning of Words.
7. Verb Alternations and Extensions.
8. A System Architecture for Multilingual Generation.
9. Generating Paraphrases.
10. From Sentences to Text.
11. Summary and Conclusions.
References.
Index.
ISBN: 0-521-301116-5 (inbunden)
ISBN: 0-521-43802-0 (pocket)
Klassikern.
Det finns en särskild intressegrupp för generering, SIGGEN. På deras hemsida finns länkar till bibliografier, projekt, forskare, programresurser m.m.
Ett exempel på djupresonemangsmetoder är planigenkänning (Allen & Perrault), som det finns mycket litteratur om, men ännu inga system som använder(?).
Domänspecifika metoder innebär ofta till stor del kunskapsinhämtande. Det kan t.ex. ske genom korpusbaserade metoder (McKeown et al, 1994).
Många system bygger sin diskursplanering på en teori om retorisk struktur (RST, Rhetorical Structure Theory) som beskrivs av Mann & Thomas 1988. Flera har också gjort sina egna tolkningar och utbyggningar av teorin.
Planeringsbaserade metoder är bra för generella textplaneringsprogram. De bygger i vissa fall på planeringsoperatorer från Artificiell intelligens (Hovy 1993, Moore & Paris 1993).
Schemabaserade metoder är mer domänsspecifika, och ofta korpusbaserade (McKeown 1985, Kittredge et al 1991).
Meningsaggregering innebär i stort borttagning av redundant information. Det kan ske genom exempelvis konjunktion, ellips, mängdformer och inbäddning (Dalianis & Hovy 1996). Vilka former man ska använda kan baseras på psykolingvistisk kunskap eller resonemang utifrån en korpus.
Lexikalisering innebär val av vilka ord som ska användas. Ordvalet påverkas av sådant som variationsönskemål, kontext och stilform. I enspråkiga system sker det ofta genom beslutsträd, en metod som ursprungligen introducerades av Goldman 1975.
Om analys av refererande uttryck som introduktion, pronomen och uttryck i bestämd form har det skrivit spaltmeter. Lite mindre har det skrivits om generering av motsvarande uttryck, och allra minst om generering av uttryck i bestämd form (Dale 1992, Dale & Reiter 1995).
Vid den lingvistiska realiseringen får meningarna och texten sin ytstruktur. Det sker utifrån exempelvis regler om verbgruppsformer (tempus, meningsformer och polaritet), kongruens och syntaktiskt nödvändiga pronominaliseringar.
Det kan bygga på tvåvägsgrammatiker. Shieber et al (1990) använde sig av en algoritm som styrs av det semantiska huvudet. Det innebär vissa problem (Busemann 1996).
Om RST och textgenerering, länk till ILEX-demo.