Lizenz
Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:kobv:517-opus-27155
URL: http://opus.kobv.de/ubp/volltexte/2008/2715/
Bögel, Tina ;
Butt, Miriam ;
Hautli, Annette ;
Sulger, Sebastian
Developing a finite-state morphological analyzer for Urdu and Hindi
Kurzfassung in Deutsch
We introduce and discuss a number of issues that arise in the process of building a finite-state morphological analyzer for Urdu, in particular issues with potential ambiguity and non-concatenative morphology. Our approach allows for an underlyingly similar treatment of both Urdu and Hindi via a cascade of finite-state transducers that transliterates the very different scripts into a common ASCII transcription system. As this transliteration system is based on the XFST tools that the Urdu/Hindi common morphological analyzer is also implemented in, no compatibility problems arise.
|
Collection: |
|
Universität Potsdam / Tagungen / Finite-state methods and natural language processing : 6th International Workshop, FSMNLP 2007 / II Regular Papers |
|
Institut: |
|
Extern |
|
DDC-Sachgruppe: |
|
Sprachwissenschaft, Linguistik |
|
Dokumentart: |
|
c InProceedings (Aufsatz / Paper einer Konferenz etc.) |
|
Sprache: |
|
Englisch |
|
Erstellungsjahr: |
|
2008 |
|
Publikationsdatum: |
|
11.12.2008 |
|
Bemerkung: |
|
The complete edition of the proceedings "Finite-state methods and natural language processing : 6th International Workshop, FSMNLP 2007 ; Revised Papers" is available:
URN urn:nbn:de:kobv:517-opus-23812 |
|
Lizenz: |
|
Diese Nutzungsbedingung gilt nicht, wenn in den Metadaten eine modifizierende Lizenz genannt ist.
Keine Nutzungslizenz vergeben - es gilt das deutsche Urheberrecht
|