Textgenereringsreferenser
Allmänt
SIGGEN (Special Interest Group on Generation)
Det finns en särskild intressegrupp för generering, SIGGEN. På deras hemsida finns länkar till bibliografier, projekt, forskare, programresurser m.m.
Samlingswebbsidor
Översikter
Konferenser/Verkst”der
Tidskrifter
Efter till”mpningsomrÂde
Helautomatiska
- Textsammanfattning (t.ex. generering av text utifrån mallar från ett informationsextraktionssystem)
- Summering (t.ex. av statistiska data eller diagram)
- Expertsystem (t.ex. beskrivning av resonemang eller generering av svar)
- Maskinöversättning (t.ex. generering av text på olika språk utifrån en språkoberoende representation)
Halvautomatiska (skrivhjälpmedel)
- Skriva affärsbrev
- Skapa administrationssammanfattningar av valda designvägar (t.ex. PLANDOC, McKeown et al, 1994)
- Skapa arbetsbeskrivningar
- Skapa programvaruinstruktioner (t.ex. Paris et al, 1995)
Efter komponent/delproblem
Efter system
- AlethGen (Coch 1996b)
- Comet (McKeown et al 1990)
- Dyd (van Deempter & Odijk 1997)
- Drafter (Paris et al. 1995)
- Ecran (Geldof & van de Velde 1997)
- Epicure (Dale 1990)
- Fog (Goldberg, Diedger & Kittredge 1994)
- Grassic (Osman et al. 1994)
- Icicle (McCoy, Pennington & Suri 1996)
- Idas (Reiter, Mellish & Levine 1995)
- Igen (Rubinoff 1992)
- Jape (Binstead & Ritchie 1997)
- ModelExplainer
- Peba
- Stop
Efter f–rfattare
- Allen, J. ochPerrault, C. 1980. Analyzing intention in utterances. Artificial Intelligence 15, s. 143-178.
- Busemann, S. 1996. Best-first surface realization. In Proceedings of the 8th International Workshop on Natural Language Generation, s. 101-110.
- Coch, JosÈ. 1996a. Evaluating and comparing three text production techniques. In Proceedings of the Sixteenth International Conference on Computational Linguistics (COLING-1996).
- Coch, JosÈ. 1996b. Overview of AlethGen. In Proceedings of the Eighth International Workshop on Natural-Language Generation (INLG-1996), s. 25-28.
- Dale, R. 1992. Generating Referring Expressions: Building/Constructing (?) Descriptions in a Domain of Objects and Processes. MIT Press.
- Dale, R. och Reiter, E. 1995. Computational interpretations of the Gricean maxims in the generation of referring expressions. Cognitive Science 19, 233-263.
- Dalianis, H. och Hovy, E. 1996. Aggregation in natural language generation. In Adorni, G. och Zock, M. (red.). Trends in Natural Language Generation, s. 88-105. Lecture Notes in Artificial Intelligence. Springer.
- Goldman, N. 1975. Conceptual Generation. In Schank, R. och Riesbeck, C. (red.). Conceptual Information Processing. American Elsevier.
- Hovy, E. 1993. Automated discourse generation using discourse structure relations. Artificial Intelligence 63, s. 341-386.
- Kittredge, R.; Korelsky, T. och Rambow, O. 1991. On the need for domain communication knowledge. Computational Intelligence 7:4 November, 305-414.
- McKeown, K. 1985. Discourse Strategies for Generating Natural-Language Text. Artificial Intelligence 27, s. 1-42.
- McKeown, K.; Kukich, K. och Shaw, J, 1994. Practical issues in automatic document generation. In Proceedings of the Fourth Conference on Applied Natural-Language Processing, s. 7-14.
- Mann, W. och Thompson, S. 1988. Rhetorical structure theory: Toward a functional theory of text organization. Text 8:3, s. 243-281. Finns även som USC/Information Sciences Institute Research Report RR-87-190.
- J. D. Moore och C. L. Paris, 1993, Planning Text for Advisory
Dialogues: Capturing Intentional and Rhetorical Information,
Computational Linguistics , 19(4):651-695.
- Paris, C.; Vander Linden, K.; Fisher, M.; Hartley, A.; Pemberton, L.; Power, R. och Scott, D. 1995. A support tool for writing multilingual instructions. In Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence, s. 1398-1404.
- Shieber, S.; van Noord, G.; Pereira, F. och Moore, R. Semantic-Head-Driven Generation. Computational Linguistics16:1 March, 30-42.
Uppgifter att klara i genereringssystem
Enligt Reiter&Dale:
Systemarkitektur
Enligt McKeown:
- Kunskapsrepresentation
- Djupgenerering - textplanering/satsplanering
- Användarmodell
- Ytgenerering
Enligt Reiter&Dale:
GOAL
|
V
___________
| TEXT |
| PLANNER |
|__________|
|
V
TEXT PLAN
|
V
___________
| SENTENCE |
| PLANNER |
|__________|
|
V
SENTENCE PLAN
|
V
_____________
| LINGUISTIC |
| REALISER |
|____________|
|
V
SURFACE TEXT
Några system
- textsammanfattning
- expertsystem
- maskinöversättning
Något om utvärdering
- Utvärdering av tre metoder för genereringssystem (Coch 1996a)
Böcker
- Building Natural Language Generation Systems, 2000, av Ehud Reiter och Robert Dale
Enligt amazon.com:
This book explains how to build Natural Language Generation (NLG) systems--computer software systems which automatically generate understandable texts in English or other human languages. NLG systems use knowledge about language and the application domain to automatically produce documents, reports, explanations, help messages, and other kinds of texts. The book covers the algorithms and representations needed to perform the core tasks of document planning, microplanning, and surface realization, using a case study to show how these components fit together.It is essential reading for researchers interested in NLP, AI, and HCI; and for developers interested in advanced document-creation technology.
Tidigare artikel från 1997 som behandlar ungefär detsamma som boken, men mer översiktligt, samt dior från tutorial finns på http://www.csd.abdn.ac.uk/~ereiter/book.html
- Aspects of Automated Natural Language Generation : Proceedings (Lecture Notes in Computer Science, Vol 587). 1992. Av Robert Dale (red.)
- Natural Language Generation in Artificial Intelligence and Computational Linguistics (The Kluwer International Series in Engineering and Computer Sci) av Cecile L. Paris, William Swartout, William Mann (red.)
Hardcover (January 1991)
Kluwer Academic Publishers; ISBN: 0792390989
Enligt amazon.com:
THIS TITLE IS CURRENTLY NOT AVAILABLE. The publisher is out of stock. If you would like to purchase this title, we recommend that you occasionally check this page to see if it's been reprinted.
Enligt amazon.com:
Editorial Reviews
From Book News, Inc. , July 1, 1991
Researchers in the field present an overview of the state-of-the-art in natural language generation, describing both current research developments and directions for future research. All aspects of the generation process are discussed within the volume's three sections on text planning, lexical choice, and grammar. Suitable as a reference for
researchers or as an advanced text for a course on the subject. Annotation copyright Book News, Inc. Portland, Or.
- New Concepts in Natural Language Generation : Planning, Realization and Systems (Communication in Artificial Intelligence Series) av Helmut Horacek, Michael Zock (red.)
Hardcover (February 1993)
Pinter Pub Ltd; ISBN: 1855670844
- Trends in Natural Language Generation : An Artificial Intelligence Perspective : Fourth European Workshop, Ewnlg '93, Pisa, Italy, April 28-30, 1993 : av Giovanni Adorni (red.), Michael Zock (red.)
Paperback (June 1996)
Springer Verlag; ISBN: 3540608001
- Lexical Semantics and Knowledge Representation in Multilingual Text Generation : The Kluwer International Series in Engineering and Computer Science) av Manfred Stede
Hardcover - (January 1999)
Enligt amazon.com:
Table of Contents
List of Figures.
List of Tables.
Preface.
1. Introduction.
2. Lexicalization in NLG.
3. Classifying Lexical Variation.
4. Modelling the Domain.
5. Levels of Representation: SITSPEC and SEMSPEC.
6. Representing the Meaning of Words.
7. Verb Alternations and Extensions.
8. A System Architecture for Multilingual Generation.
9. Generating Paraphrases.
10. From Sentences to Text.
11. Summary and Conclusions.
References.
Index.
- Text Generation: using discourse strategies and focus constraints to generate natural language text. 1985. Av Kathleen McKeown. Cambridge University Press.
ISBN: 0-521-301116-5 (inbunden)
ISBN: 0-521-43802-0 (pocket)
Klassikern.
Övriga referenser
Kortfattad översikt
- Djupresonemangsmetoder
Ett exempel på djupresonemangsmetoder är planigenkänning (Allen & Perrault), som det finns mycket litteratur om, men ännu inga system som använder(?).
- Domänspecifika metoder
Domänspecifika metoder innebär ofta till stor del kunskapsinhämtande. Det kan t.ex. ske genom korpusbaserade metoder (McKeown et al, 1994).
Många system bygger sin diskursplanering på en teori om retorisk struktur (RST, Rhetorical Structure Theory) som beskrivs av Mann & Thomas 1988. Flera har också gjort sina egna tolkningar och utbyggningar av teorin.
- Planeringsbaserade metoder
Planeringsbaserade metoder är bra för generella textplaneringsprogram. De bygger i vissa fall på planeringsoperatorer från Artificiell intelligens (Hovy 1993, Moore & Paris 1993).
- Schemabaserade metoder
Schemabaserade metoder är mer domänsspecifika, och ofta korpusbaserade (McKeown 1985, Kittredge et al 1991).
Meningsaggregering innebär i stort borttagning av redundant information. Det kan ske genom exempelvis konjunktion, ellips, mängdformer och inbäddning (Dalianis & Hovy 1996). Vilka former man ska använda kan baseras på psykolingvistisk kunskap eller resonemang utifrån en korpus.
Lexikalisering innebär val av vilka ord som ska användas. Ordvalet påverkas av sådant som variationsönskemål, kontext och stilform. I enspråkiga system sker det ofta genom beslutsträd, en metod som ursprungligen introducerades av Goldman 1975.
Om analys av refererande uttryck som introduktion, pronomen och uttryck i bestämd form har det skrivit spaltmeter. Lite mindre har det skrivits om generering av motsvarande uttryck, och allra minst om generering av uttryck i bestämd form (Dale 1992, Dale & Reiter 1995).
Vid den lingvistiska realiseringen får meningarna och texten sin ytstruktur. Det sker utifrån exempelvis regler om verbgruppsformer (tempus, meningsformer och polaritet), kongruens och syntaktiskt nödvändiga pronominaliseringar.
Rhetorical Structure Theory
Personer
S–k mer
Research Index
Projektbibliografi
Bib-fil