Extraction De Connaissances Pour La Description De L . - IRISA

1y ago
29 Views
2 Downloads
1.20 MB
19 Pages
Last View : 1m ago
Last Download : 3m ago
Upload by : Troy Oden
Transcription

Extraction de connaissances pour la description del’environnement maritime côtier à partir de textesd’aide à la navigationLéa Lamotte (LaSTIG)Nathalie Abadie (LaSTIG)Eric Saux (IRENav)Eric Kergosien (GERiiCO)EGC 2020 - Bruxelles - Atelier GAST

Les Instructions Nautiques du Service Hydrographique etOcéanographique de la Marine (SHOM) Ouvrage en 26 tomes :couverture de la zone côtièrefrançaise, espagnole, tion/ouvrages/instructions-nautiques.html Notre cas d’étude :étude de la zone allant de lafrontière belge à la pointe dePenmarc’h (instruction IN C22France, côte Nord et Ouest)

Les Instructions Nautiques du Service Hydrographique etOcéanographique de la Marine (SHOM) Contiennent des connaissances surl’environnement maritime et côtiers,complémentaires aux descriptionscartographiques Textes rédigés et mis à jour pardifférents auteurs et publiés par unétablissement public assure unfrançais standard, une bonnediversité dans les formes présenteset une abstraction des habitudeslangagières subjectives oudiachroniques.

Les Instructions Nautiques du Service Hydrographique etOcéanographique de la Marine (SHOM)Les IN du SHOM décrivent : les amers et dangers pour la navigation côtière, les courants, les ports et mouillages, leurs chenaux d’accès, leurs équipements et les services proposés aux navigateurs, etc.Étant destinés à être lus en complément des cartes marines lorsque les navigateurs préparent leuritinéraire, ces IN suivent avant tout une organisation géographique : décrivent la côte linéairement, d’unport à l’autre, du Nord vers le Sud et sauf mention contraire, vue depuis la mer.L’extrait suivant présente une description du paysage typique de ce corpus :"[.]La Pointe de Pléneuf est débordée vers le NW par l’îlot Le Verdelet, puis jusqu’à 1,5 M au large par lePlateau des Jaunes, découvrant ; celui-ci, ainsi que les hauts-fonds rocheux qui s’étendent dans l’Ouestdu Verdelet, sont couverts par le secteur rouge (146 -196 ) du feu de la tourelle La Petite Muette située àl’entrée de Dahouët.[.]"

un complément des “electronic navigational chart” (ENC)Source: http://data.shom.frFormat standardisé(S57 - IHO) :

Entre descriptions textuelles du terrainet bases de données géographiques vectoriellesSource: http://data.shom.fr“Le Port de Saint-Cast (48 38’ N, 2 15’ W) est adossé à la Pointe de Saint-Cast, au Sud. [.] Il comprend unbassin à flot et une zone d'échouage. [.]Un court chenal, à peu près parallèle à la jetée, conduit à la passe d’accès au bassin. Il est balisé par deuxpaires de bouées latérales lumineuses.”

Une représentation du terraindans un système de références spatiales indirect Extraire et structurer les informations à références spatiales (notamment indirecte) pourconstruire et peupler des référentiels de données géographiques :- pour assurer la médiation (complémentarité, redondance, incohérence) entre lesdonnées qualitatives et quantitatives48 38’ N, 2 15’ Wgeo:coorddef: PortPort de Saint-Castrdf:typerdfs:labelrdf:typeid: 5648def: Zone d’échouagePointe de Saint-Castdef: Pointersp:auSudDerdfs:labelid: 5649gsp:sfContainsgsp:sfContainsrdf:typeid: 5640id: 5647rsp:baliséParrdf:typeid: 5641def: Bassinà did: 5645id: 5642rdf:typeid: 5646rdf:typerdf:typedef: Chenalid: 5643def:BouéeLatéraleLumineuseBabord

Vers une base de connaissances de l’environnementhydrographique côtierFIG. 1 – De l’extraction d’information géographique à partir de textes à son exploitation ausein d’une base de connaissances.ExtractionReprésentation

Préparation du corpusVersion des IN au format XML : chapitres, sous-chapitres, paragraphes, etc.Particularités : Chaque portion de côte est décrite par un même locuteur : pour se doter decorpus non biaisés par le style d’écriture d’une personne, un découpage nongéographique du texte est donc préférable. Il faut conserver des portions de texte cohérentes pour permettre larésolution des coréférences.Solution adoptée : Découpage au niveau des balises “paragraphes” etnumérotation dans l’ordre. Répartition en 3 sous-corpus :- si n multiple de 5 corpus de test- si n 1 multiple de 5 corpus de développement- paragraphes restants corpus d’entraînement

Chaîne de traitement pour l’extractionbases de données géographiquesvectorielles "BD NYME " et des EnNSEtiquetageen partiesdu discoursMarquagedes ENSMarquagedes relationsspatialesMarquagedespropriétéset valeursRésolutiondesarguments

Extraction des entités spatiales à base de patrons Patrons lexico-syntaxiques pour l’extraction des ENS :( descr ADJ * DP *)*( maj DP *)* topo ( DP * maj )* geogName geogFeat phare /geogFeat de l' geogFeat Île /geogFeat de name Sein /name /geogName descr ADJ *( DP descr ADJ *)* DP * maj ( DP * maj )* geogName geogFeat roche /geogFeat détachée de la geogFeat Pointe /geogFeat des name Grottes /name /geogName Patron lexico-syntaxique pour l’extraction des EnNS : DET * NOM * Car * DP * ADJ * descr Mod *( DET WORD )* ESnN angle Sud-Est de la baie /ESnN

Extraction des entités spatiales : résultats Implémentation sous UniTEXCorpus de développementCorpus de testPrécisionRappelF-MesureENS : CasEN0.160.190.17ENS : Perdido0.730.160.26ENS : Notre approche0.840.610.7ENS : Notre approche0.790.720.75EnNS : Notre approche0.320.570.41 CasEN détecte comme ENS :- les points cardinaux- les articles définis au pluriel en début de phrase Perdido et CasEN : lexiques généralistes, peu adaptés au domaine maritimecôtier.

Extraction des relations spatiales Un corpus (IN C22 France, côte Nord et Ouest) très riche en relations spatiales : 1618 relations spatiales sur le corpus detest avec une grande variété de formulations!Ex. pour les relations de distance qualitative :au large de, au voisinage de, autour de, aux abords de, aux environs du, dominant,déborder, en bordure de, en face de, enraciné au, environnant, est bordé de, le long de, leplus au large, nettement détaché de, plus au large, proche de, près de, border, émerger de,se détacher nettement de, voisins l'un de l'autre, à l'écart de, à l'entrée de, à l'extérieur de, àla limite de, à la lisière de, à proximité de, à toucher, etc. Mise en place de patrons lexico-syntaxiques pour rechercher des expressionsexprimant des relations de :- distances qualitative et quantitative- direction- adjacence- traversée- inclusion (“contient” ou “à l’intérieur de”)- “entre”

Référencement indirect d’entités spatiales Différents référentiels spatiaux existants (relatif, absolu, intrinsèque)En référentiel intrinsèque“Laisser la bouée à tribord” En référentiel relatif“Suivre la direction du clocher à droite du phare”Définition d’un 5-tuple Locatum,Relatum,Relation,Origine,Orientation afinde caractériser une relation spatiale entre deux objets

Extraction des relations spatiales : erse1.00.60.75Contient0.720.710.72A l’intérieur de0.560.420.48Entre0.570.760.65Relations :marquage0.780.740.76Relations :classification0.740.710.72

Résolution des argumentsBut : identifier, pour chaque relation, son relatum et son locatum.Approche : représentation simplifiée du texte : ponctuations fortes, conjonctionsde coordination, entités et relations spatiales, dans l’ordre.Exemple :“Au Nord du clocher de Ploubazlanec se trouve un château d’eau remarquable”[“Au Nord de”, “clocher de Ploubazlanec”, “château d’eau remarquable”]locatum "château d’eau remarquable",relation "Au Nord de ",relatum "clocher de Ploubazlanec"

Résolution des arguments : résultatsPrécisionRappelF-mesureTriplet (marquagemanuel)0.690.630.66Triplet 3Relatum0.620.440.48

Conclusion Traitement des problématiques de l’extraction : d’entités spatiales nommées (ESN) d’entités spatiales non-nommées (ESnN) de relations spatiales (RS) et des éléments nécessaires à leurinterprétation hors-contexte Particularité du corpus maritime côtier moins favorables aux approchesPerdido et CasEN Résultats encourageants fondés sur- des patrons prenant en compte la casse- le contexte lexical- des lexiques ("BD NYME " de l’IGN et "Toponymes" du SHOM)Perspectives : Désambiguïsation lexicale Détection et correction d’éventuelles incohérences spatiales dans lesinformations extraites, inférence de relations entre ES Exploitation des relations spatiales pour le géoréférencement

Merci!

Les Instructions Nautiques du Service Hydrographique et Océanographique de la Marine (SHOM) Les IN du SHOM décrivent : les amers et dangers pour la navigation côtière, les courants, les ports et mouillages, leurs chenaux d'accès, leurs équipements et les services proposés aux navigateurs, etc.

Related Documents:

Advance Extraction Techniques - Microwave assisted Extraction (MAE), Ultra sonication assisted Extraction (UAE), Supercritical Fluid Extraction (SFE), Soxhlet Extraction, Soxtec Extraction, Pressurized Fluid Extraction (PFE) or Accelerated Solvent Extraction (ASE), Shake Flask Extraction and Matrix Solid Phase Dispersion (MSPD) [4]. 2.

Licensing the ENVI DEM Extraction Module DEM Extraction User's Guide Licensing the ENVI DEM Extraction Module The DEM Extraction Module is automatically installed when you install ENVI. However, to use the DEM Extraction Module, your ENVI licen se must include a feature that allows access to this module. If you do not have an ENVI license .

Pour une transition facile de S5 à S7 Connaissances fondamentales pour le personnel technique. Décrit la marche à suivre pour réaliser des tâches d‘automatisation avec STEP 7 et S7-300/400. 6ES7810-4CA08-8CW0 STEP 7 Manuels de référence sur les Langages CONT/LOG/LIST pour SIMATIC S7-300/400 Logiciel système pour

follows here is a brief overview of how flowsheet data are used in pinch analysis. Data extraction is covered in more depth in "Data Extraction Principles" in section 10. 3.1 Data Extraction Flowsheet Data extraction relates to the extraction of information required for Pinch Analysis from a given process heat and material balance.

All in all, the DNA extraction labs are very workable. Try some and then decide if you would like to modify any to fit your needs better. Good luck!! Onion DNA Extraction Wheat Germ DNA Extraction Lima Bean Bacteria DNA Extraction Yeast DNA Extraction Thymus DNA

(Yang et al., 2007), extraction of major catechin and caffeine from green tea using different solvents (Perva-Uzunalić et al., 2006), solvent extraction of catechin from Korean tea (Row and Jin 2006), extraction of bioactive compounds from green tea using aqueous extraction (Komes et al., 2010). In addition, comparison of the hot and cold .

Guide pour évaluer les Connaissances, Attitudes et Pratiques liées à la nutrition Manuel par Yvette Fautsch Macías Dt. P., M.Sc. Consultante en nutrition, FAO et Peter Glasauer Ph. D. Division de la nutrition (ESN), FAO Organisati

Mon passeport du civisme, pour quoi faire ? p. 4 Carte d’identité p. 5 Pour aimer la France : Aimer sa commune ! p. 6 Médailles p. 7 Pour le devoir de mémoire p. 8-9 Pour savoir donner p. 10-11 Pour surfer en sécurité p. 12-13 Pour prendre soin de ses aînés p. 14-15 Pour préserver son environnement p. 16-17