-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy path2019-03-stEtienne.html
238 lines (238 loc) · 63.6 KB
/
2019-03-stEtienne.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
<html xmlns="http://www.w3.org/1999/xhtml" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:t="http://www.tei-c.org/ns/1.0" xml:lang="en"><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></meta><title>Propositions de la TEI pour l'indexation: </title><meta name="generator" content="Generated by TEISLIDY stylesheet"></meta><script src="https://www.w3.org/Talks/Tools/Slidy/slidy.js" type="text/javascript"></script><link rel="stylesheet" type="text/css" media="screen, projection" href="https://www.w3.org/Talks/Tools/Slidy/show.css"></link><link href="../css/egXMLhandling.css" rel="stylesheet" type="text/css"></link><link href="../css/tei.css" rel="stylesheet" type="text/css"></link></head><body class="simple" id="TOP"><div class="slide cover"><img src="media/logo.jpg" width="40%" style="float:left" alt="[Put logo here]" class="cover"></img><br clear="all"></br><h1>Propositions de la TEI pour l'indexation: </h1><h3 class="sub">encodage de texte ou encodage de donnée ?</h3><p>Lou Burnard</p></div><div class="slide"><div class="frame"><div class="col"><h2>C'est quoi, l'indexation?</h2><div class="figure"><img src="media/manicule.jpg" alt="" class="graphic"></img></div></div><div class="col"><p>Un index, au sens classique, fournit une manière de flècher au sein d'un texte continu : </p><ul><li class="item">des passages d'interêt, caracterisés d'une manière quelconque</li><li class="item">des références à des unités lexicales ayant un intérêt sémantique</li><li class="item">notamment les noms de lieux, de personnes, des évènements, ou des objets etc</li></ul><p> Un index est donc un ensemble (d'habitude organisé et structuré) de <em>pointeurs</em>, chacun contenant un label, et une déscription</p></div></div></div><div class="slide"><h2>Balisage et indexation</h2><p class="box"><span class="quote">‘Markup reflects a theory of text’</span> (Sperberg-McQueen, 1991)</p><p>On pourrait considérer que l'acte même de balisage serait une forme d'indexation... </p><ul><li class="item">en balisant, nous choissisons une partie d'un texte et nous la catégorisons d'une manière quelconque</li><li class="item">ces catégories pourraient très bien correspondre avec les termes d'un index</li></ul><p>Mais c'est habituel de distinguer </p><ul><li class="item">l'annotation (le surajout des catégorisations) de</li><li class="item">l'indexation (l'indication des locations textuelles auxquelles ces catégorisations s'appliquent)</li></ul></div><div class="slide"><h2>La balise <index></h2><p>La TEI propose un élément spécifique pour faciliter la création d'un index classique</p><ul><li class="item">à chaque point de répérage ciblé par l'index on met une balise <span class="gi"><index></span></li><li class="item">on précise par un <span class="gi"><term></span> l'entrée sous lequel on souhaite indexer ce point</li><li class="item">les <span class="gi"><index></span> peuvent s'imbriquer</li></ul><pre class="pre_eg cdata">... The Tangerine Dream (où officiaent deux danseuses du ventre Zazou et Asiza)...</pre><div id="index.xml-egXML-d30e89" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><p></span>... The Tangerine Dream <span class="element"><index></span>
<span class="element"><term></span>
<span class="element"><hi></span>Tangerine Dream<span class="element"></hi></span> Cabaret
parisien<span class="element"></term></span>
<span class="element"></index></span> (où officiaent deux danseuses du ventre Zazou et Asiza)...
<span class="element"><index></span>
<span class="element"><term></span>ZAZOUA danseuse du ventre<span class="element"></term></span>
<span class="element"></index></span>
<span class="element"><index></span>
<span class="element"><term></span>ASIZA danseuse du ventre<span class="element"></term></span>
<span class="element"></index></span> ... <span class="element"></p></span></div><div class="p">L'attribut <span class="att">indexName</span> permet de spécifier un index particulier: <div id="index.xml-egXML-d30e111" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><p></span>... The Tangerine Dream <span class="element"><index <span class="attribute">indexName</span>="<span class="attributevalue">Index-des-lieux</span>"></span>
<span class="element"><term></span>
<span class="element"><hi></span>Tangerine
Dream<span class="element"></hi></span> Cabaret parisien<span class="element"></term></span>
<span class="element"></index></span> (ou officiaent deux danseuses du
ventre Zazou et Asiza)... <span class="element"><index <span class="attribute">indexName</span>="<span class="attributevalue">Index-des-personnes</span>"></span>
<span class="element"><term></span>ZAZOUA danseuse
du ventre<span class="element"></term></span>
<span class="element"></index></span>
<span class="element"><index <span class="attribute">indexName</span>="<span class="attributevalue">Index-des-personnes</span>"></span>
<span class="element"><term></span>ASIZA danseuse du ventre<span class="element"></term></span>
<span class="element"></index></span>
... <span class="element"></p></span></div></div><p>On peut aussi specifier une hierarchie des termes :</p><div id="index.xml-egXML-d30e130" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><p></span>... The Tangerine Dream <span class="element"><index></span>
<span class="element"><term></span>Cabaret parisien<span class="element"></term></span>
<span class="element"><index></span>
<span class="element"><term></span>Tangerine Dream<span class="element"></term></span>
<span class="element"></index></span>
<span class="element"></index></span>...<span class="element"></p></span>
<span class="element"><p></span> ... Le Petit Casino <span class="element"><index></span>
<span class="element"><term></span>Cabaret parisien<span class="element"></term></span>
<span class="element"><index></span>
<span class="element"><term></span>Petit Casino<span class="element"></term></span>
<span class="element"></index></span>
<span class="element"></index></span>
<span class="element"></p></span></div><p class="box">Attention: comme ailleurs, la prise en charge de la création des indexes à partir de cette balisage n'est pas assurée par la TEI!</p></div><div class="slide"><h2>Indexation et représentation des expressions référentielles</h2><ul><li class="item">Pour construire un index des phrases démotiques ou exotiques, des passages jolis, des paragraphes controversés etc., l'usage de <span class="gi"><index></span> peut tres bien suffir.</li><li class="item">Mais il n'est pas aussi bien adapté au cas plus typique: la construction d'un index des <span class="hi">expressions référentielles</span></li><li class="item">Par <span class="q">‘expression référentielle’</span> nous entendons tout mot ou phrase qui fait référence à une entité (une personne, un evenement, un lieu) dans le monde, par ex. un nom propre, un titre, etc.</li><li class="item">L'identification et l'annotation des expressions référentielles servent à traverser une frontière importante: des mots constitutifs d'un texte jusqu'aux entités signallées par ce texte... voire sa sémantique. </li></ul><p class="box">Révéler la vraie sémantique d'un document ... la rêve des indexeurs</p></div><div class="slide"><h2>Sommaire des propositions de la TEI pour les expressions référentielles</h2><p>Quelques exemples des expressions qu'on pourrait souhaiter distinguer/annoter/indexer </p><div id="index.xml-egXML-d30e177" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><name></span>Nancy<span class="element"></name></span> est adorable...
<span class="element"><placeName></span>Nancy<span class="element"></placeName></span> est ma ville préférée ...
<span class="element"><rs></span>Elle<span class="element"></rs></span> est jolie.
</div><ul><li class="item">signaller la présence d'une référence : <span class="gi"><name></span> et <span class="gi"><rs></span>.</li><li class="item">distinguer plus nettement le type de référence : <span class="gi"><persName></span>, <span class="gi"><placeName></span>, <span class="gi"><orgName></span> ...</li><li class="item">distinguer les composants de ces références (par ex <span class="gi"><surname></span>, <span class="gi"><location></span>, <span class="gi"><addName></span> etc.)</li><li class="item">associer une référence avec un ensemble d'information concernant son référent (<span class="gi"><person></span>, <span class="gi"><place></span> etc.) <ul><li class="item">pour la désambiguïser</li><li class="item">pour la sémanticiser </li></ul></li></ul><p class="box">Grosse question : comment s'exprime la sémantique du balisage TEI ?</p></div><div class="slide"><h2>Encodage des références (1) </h2><p>Un élément très générique est disponible en TEI : il s’agit de <span class="gi"><rs></span>, qui signifie « expression référentielle » (referencing string)</p><p>Il peut contenir un nom propre, mais aussi un pronom, une périphrase, ou toute autre façon de référencer un objet identifiable</p><div id="index.xml-egXML-d30e243" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><rs></span>le président de la république<span class="element"></rs></span>
<span class="element"><rs></span>la personne que j'ai rencontrée dans la rue<span class="element"></rs></span>
<span class="element"><rs></span>sa ville préférée<span class="element"></rs></span></div><p>Mais ceux-ci sont peut-etre plus douteux: </p><div id="index.xml-egXML-d30e252" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><p></span> D'<span class="element"><rs></span>une ville inconnue<span class="element"></rs></span> elle s'est
retirée dans une <span class="element"><rs></span>thébaïde<span class="element"></rs></span>
<span class="element"></p></span></div></div><div class="slide"><h2><span class="gi"><rs></span>: une balise qui fait tout</h2><div id="index.xml-egXML-d30e265" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><rs <span class="attribute">type</span>="<span class="attributevalue">org</span>"></span>La famille<span class="element"></rs></span> s'était alors retirée en banlieue, à
<span class="element"><rs <span class="attribute">type</span>="<span class="attributevalue">place</span>"></span>Villemomble<span class="element"></rs></span>, mais <span class="element"><rs <span class="attribute">type</span>="<span class="attributevalue">person</span>"></span>Alfred<span class="element"></rs></span>
aimait se rendre à <span class="element"><rs <span class="attribute">type</span>="<span class="attributevalue">place</span>"></span>Paris<span class="element"></rs></span> et
<span class="element"><date></span>un jour de 1917<span class="element"></date></span> alors qu'il sortait de
<span class="element"><rs <span class="attribute">type</span>="<span class="attributevalue">place</span>"></span>la musée des Arts et Métiers<span class="element"></rs></span> il était tombé
inanimé dans <span class="element"><rs <span class="attribute">type</span>="<span class="attributevalue">place</span>"></span>la rue<span class="element"></rs></span>.... </div><p>Attention: les valeurs de l'attribut <span class="att">type</span> ne sont pas forcément contrôlés de la TEI</p><p>Un élément plus spécifique existe pour distinguer les noms propres des autres types de référence: <span class="gi"><name></span>...</p><div id="index.xml-egXML-d30e299" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><rs <span class="attribute">type</span>="<span class="attributevalue">org</span>"></span>La famille<span class="element"></rs></span> s'était alors retirée en banlieue, à
<span class="element"><name <span class="attribute">type</span>="<span class="attributevalue">place</span>"></span>Villemomble<span class="element"></name></span>, mais <span class="element"><name <span class="attribute">type</span>="<span class="attributevalue">person</span>"></span>Alfred<span class="element"></name></span>
aimait se rendre à <span class="element"><name <span class="attribute">type</span>="<span class="attributevalue">place</span>"></span>Paris<span class="element"></name></span> et <span class="element"><date></span>un jour de 1917<span class="element"></date></span>
alors qu'il sortait de <span class="element"><rs <span class="attribute">type</span>="<span class="attributevalue">place</span>"></span>la musée des Arts et Métiers<span class="element"></rs></span> il était
tombé inanimé dans <span class="element"><rs <span class="attribute">type</span>="<span class="attributevalue">place</span>"></span>la rue<span class="element"></rs></span>.</div></div><div class="slide"><h2>Des éléments plus précises...</h2><p>Au lieu d'une balise <span class="gi"><name type="xxx"></span>, la TEI propose une balise <span class="gi"><xxxName></span></p><ul><li class="item"><span class="gi"><persName></span> : nom de personne</li><li class="item"><span class="gi"><placeName></span> : nom de lieu</li><li class="item"><span class="gi"><orgName></span> : nom d'organisation</li><li class="item"><span class="gi"><geogName></span> : nom d'un entité geographique</li></ul></div><div class="slide"><h2>Quel est l'interêt de ce type d'encodage (dite "sémantique")?</h2><ul><li class="item">mise en relation des textes </li><li class="item">traitement type TAL, cartographie, indexation... </li><li class="item">optimisation de recherche et moteur de recherche sémantique</li><li class="item">production de savoir par inférence (classification de documents par exemple)</li><li class="item">... bref, utiliser un ensemble de textes comme une base de données</li></ul></div><div class="slide"><div class="frame"><div class="col"><h2>Encodage des références aux personnes </h2><div class="figure"><img src="media/montaigne.jpg" alt="" class="graphic" style=" height:60%;"></img></div></div><div class="col"><p>L'élément <span class="gi"><persName></span> s'applique à tout nom propre ou périphrase qui fait référence à un personnage, réel ou imaginaire</p><div id="index.xml-egXML-d30e377" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><persName></span>Michel Eyquem de Montaigne<span class="element"></persName></span></div><div id="index.xml-egXML-d30e380" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><persName></span>Christopher Robin<span class="element"></persName></span></div><div id="index.xml-egXML-d30e383" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><persName></span>Geoffroy Grisegonelle<span class="element"></persName></span></div><p>Les noms personnel peuvent avoir une structure intéressante et complexe... </p></div></div></div><div class="slide"><h2>Composants des noms de personnes</h2><ul><li class="item"><span class="gi"><forename></span> : prénom, nom de baptême</li><li class="item"><span class="gi"><surname></span> : nom de famille (hérité)</li><li class="item"><span class="gi"><roleName></span> : titre officiel, rang, position dans la société</li><li class="item"><span class="gi"><nameLink></span> : particule</li><li class="item"><span class="gi"><genName></span> : attribut générationnel (Pline «le Jeune», Henri «IV»)</li><li class="item"><span class="gi"><addName></span> : nom supplémentaire, par ex surnom, épithète, alias, périphrase descriptive</li><li class="item">... et bien sur d'autre types de nom propre (<span class="gi"><placeName></span>, <span class="gi"><orgName></span> ... )</li></ul><div id="index.xml-egXML-d30e425" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><persName></span>
<span class="element"><forename></span>Geoffroy<span class="element"></forename></span>
<span class="element"><genName></span>Ier<span class="element"></genName></span>
<span class="element"><roleName></span>comte d'<span class="element"><placeName></span>Anjou<span class="element"></placeName></span>
<span class="element"></roleName></span>
<span class="element"><nameLink></span>dit<span class="element"></nameLink></span>
<span class="element"><addName></span>Grisegonelle<span class="element"></addName></span>
<span class="element"></persName></span></div><div id="index.xml-egXML-d30e440" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><persName <span class="attribute">xml:lang</span>="<span class="attributevalue">ru</span>"></span>
<span class="element"><forename <span class="attribute">type</span>="<span class="attributevalue">first</span>"></span>Владимир<span class="element"></forename></span>
<span class="element"><forename <span class="attribute">type</span>="<span class="attributevalue">patronymic</span>"></span>Владимирович<span class="element"></forename></span>
<span class="element"><surname></span>Маяковский<span class="element"></surname></span>
<span class="element"></persName></span></div><div id="index.xml-egXML-d30e448" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><persName <span class="attribute">xml:lang</span>="<span class="attributevalue">ara</span>"></span>
<span class="element"><surname></span>بن نوح<span class="element"></surname></span>
<span class="element"><forename></span>الحسن<span class="element"></forename></span>
<span class="element"><addName <span class="attribute">type</span>="<span class="attributevalue">kunyah</span>"></span>أبو منصور<span class="element"></addName></span>
<span class="element"><addName <span class="attribute">type</span>="<span class="attributevalue">nisbah</span>"></span>القمري<span class="element"></addName></span>
<span class="element"></persName></span></div></div><div class="slide"><div class="frame"><div class="col"><h2>Encodage des références aux lieux </h2><div class="figure"><img src="media/egliseStX.jpg" alt="" class="graphic" style=" height:60%;"></img></div></div><div class="col"><p>L'élément <span class="gi"><placeName></span> s'applique à tout nom de lieu absolu ou relatif, reel ou imaginaire par ex. le nom d’un bâtiment, village, ville , pays ...</p><div id="index.xml-egXML-d30e470" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><placeName></span>Eglise Saint-Christophe à Tours<span class="element"></placeName></span></div><p>Les éléments de ce type souvent s'imbriquent... </p><div id="index.xml-egXML-d30e475" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><placeName></span>Église
<span class="element"><persName></span>
<span class="element"><roleName></span>Saint<span class="element"></roleName></span>-Christophe
<span class="element"></persName></span>
à <span class="element"><placeName></span>Tours<span class="element"></placeName></span>
<span class="element"></placeName></span></div></div></div></div><div class="slide"><div class="frame"><div class="col"><h2>Encodage des références aux organisations</h2><p>L'élément <span class="gi"><orgName></span> s'applique au nom d’une organisation, d’une institution, d'une societe, ou même d'un tribu.</p><div id="index.xml-egXML-d30e493" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><orgName></span>Les Beatles<span class="element"></orgName></span></div><div id="index.xml-egXML-d30e496" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><orgName></span>Microsoft Inc<span class="element"></orgName></span></div><div id="index.xml-egXML-d30e499" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><orgName></span>Chapitre de <span class="element"><persName></span>
<span class="element"><roleName></span>Saint<span class="element"></roleName></span> Léon <span class="element"></persName></span>
<span class="element"></orgName></span></div></div><div class="col"><div class="figure"><img src="media/beatles.jpg" alt="" class="graphic" style=" height:50%;"></img></div></div></div></div><div class="slide"><div class="frame"><div class="col"><h2>Encodage des références aux objets geographiques</h2><div class="figure"><img src="media/dunePilat.jpg" alt="" class="graphic" style=" height:50%;"></img></div></div><div class="col"><p>L'élément <span class="gi"><geogName></span> s'applique aux noms ayant une caractéristique géographique (un mont, une fleuve, une vallée ... )</p><p>Il peut contenir un élément <span class="gi"><geogFeat></span> qui s'applique a un nom commun (par ex. <span class="hi">mont, fleuve, vallée, montagne</span>...) contenu par le nom géographique</p><div id="index.xml-egXML-d30e528" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><geogName></span>
<span class="element"><geogFeat></span>Dune<span class="element"></geogFeat></span> de <span class="element"><name></span>Pilat<span class="element"></name></span>
<span class="element"></geogName></span></div></div></div></div><div class="slide"><h2>Enrichissement progressif d'un texte</h2><div class="figure"><img src="media/sayeda-dtl.png" alt="" class="graphic" style=" height:30%;"></img></div><div id="index.xml-egXML-d30e541" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><p></span>La demande de construction a été addressée par le sieur <span class="element"><name></span>Hag Ahmed Mohamed<span class="element"></name></span>
pour bâtir son terrain à côté de la mosquée <span class="element"><name></span>Suyadi Mohamed el-Anouar<span class="element"></name></span>, sise
à chara <span class="element"><name></span>el-Sayeda Sekina<span class="element"></name></span>
<span class="element"></p></span></div><div id="index.xml-egXML-d30e552" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><p></span>La demande de construction a été addressée par le sieur <span class="element"><persName></span>Hag Ahmed
Mohamed<span class="element"></persName></span> pour bâtir son terrain à côté de la mosquée <span class="element"><placeName></span>Suyadi
Mohamed el-Anouar<span class="element"></placeName></span>, sise à chara <span class="element"><name></span>el-Sayeda Sekina<span class="element"></name></span>
<span class="element"></p></span></div><div id="index.xml-egXML-d30e563" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--> ... sise à chara <span class="element"><placeName></span>el-
<span class="element"><persName <span class="attribute">ref</span>="<span class="attributevalue">https://www.wikidata.org/wiki/Q584737</span>"></span> Sayeda Sekina <span class="element"></persName></span>
<span class="element"></placeName></span></div></div><div class="slide"><h2>Un <span class="gi"><persName></span>n'est pas un <span class="gi"><person></span>! </h2><div class="p">Dans un texte nous trouvons souvent plusieurs références à la même personne de manières différentes <div id="index.xml-egXML-d30e581" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely-->...<span class="element"><persName></span>Clara Schumann<span class="element"></persName></span>
...<span class="element"><persName></span>Clara<span class="element"></persName></span>
...<span class="element"><persName></span>Frau Schumann<span class="element"></persName></span> ... </div></div><p>Nous considérons que tous ces noms réfèrent à la même personne. Comment le signaller ?</p><p>De même, il arrive que nous trouvons des noms identiques qui (à notre avis) réfèrent à des personnes différentes. Comment le signaller ?</p><p>La TEI propose deux attributs, disponibles sur tous les éléments de dénomination, pour spécifier à quelle entité on réfère : </p><ul><li class="item"><span class="att">key</span> pour spécifier un code prédéfini associé avec l'entité dénommée, d'un format arbitraire</li><li class="item"><span class="att">ref</span> pour pointer sur une définition de l'entité dénommée : forcément un URI</li></ul><div id="index.xml-egXML-d30e608" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely-->
...<span class="element"><persName <span class="attribute">ref</span>="<span class="attributevalue">#CS</span>"></span>Clara Schumann<span class="element"></persName></span>
...<span class="element"><persName <span class="attribute">ref</span>="<span class="attributevalue">#CS</span>"></span>Clara<span class="element"></persName></span>
...<span class="element"><persName <span class="attribute">ref</span>="<span class="attributevalue">#CS</span>"></span>Frau Schumann<span class="element"></persName></span> ... </div><p><code>#CS</code> est un URI: il devrait correspondre à un autre élément de notre document (a priori un <span class="gi"><person></span>)</p></div><div class="slide"><h2>Relier les noms propres à des ontologies externes </h2><p>Toutes les balises de références textuelles permettent également ce type de connexion à des referentiels (ou ontologies) externes </p><ul><li class="item">@ref : pointeur vers une définition </li></ul><div id="index.xml-egXML-d30e634" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><persName <span class="attribute">ref</span>="<span class="attributevalue">http://viaf.org/viaf/44499359</span>"
<span class="attribute">type</span>="<span class="attributevalue">person</span>"></span>Clara<span class="element"></persName></span></div><ul><li class="item">@key : utiliser un code quelconque</li></ul><div id="index.xml-egXML-d30e640" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><persName <span class="attribute">key</span>="<span class="attributevalue">Schumann, Clara (1819 1896)</span>"></span>Clara<span class="element"></persName></span></div><p class="box">Cette mécanisme permet la résolution des ambiguités en rendant explicite une interprétation du texte </p></div><div class="slide"><h2>Les entités TEI (1)</h2><p>TEI propose des éléments spécifiques pour regrouper des informations concernant les entités nommées (en plus de leur noms): </p><ul><li class="item"><span class="gi"><person></span>, <span class="gi"><place></span>, <span class="gi"><event></span></li><li class="item">ces éléments peuvent être regroupés en <span class="gi"><listPerson></span>, <span class="gi"><listPlace></span>, etc.</li><li class="item">des relations peuvent aussi aussi être modélisées, utilisant explicitement <span class="gi"><relation></span> ou implicitement grâce au contexte</li></ul><div class="p">Par exemple voici notre connaissance d'un certain Wladimir Maïakowski : <div id="index.xml-egXML-d30e675" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><person <span class="attribute">xml:lang</span>="<span class="attributevalue">fr</span>" <span class="attribute">xml:id</span>="<span class="attributevalue">VM1893</span>"></span>
<span class="element"><persName <span class="attribute">xml:lang</span>="<span class="attributevalue">ru</span>"></span>Владимир Владимирович Маяковский<span class="element"></persName></span>
<span class="element"><persName></span>Wladimir Maïakowski<span class="element"></persName></span>
<span class="element"><birth <span class="attribute">when</span>="<span class="attributevalue">1893-07-19</span>"></span>7 July (OS) 1893, <span class="element"><placeName <span class="attribute">ref</span>="<span class="attributevalue">#BGDT</span>"></span>Baghdati,
Georgie<span class="element"></placeName></span>
<span class="element"></birth></span>
<span class="element"><death <span class="attribute">when</span>="<span class="attributevalue">1930-04-14</span>"/></span>
<span class="element"><occupation></span>
<span class="element"><p></span>Poète et dramaturge, l'un des plus éminents représentants du futurisme
de la Russie du début du XXe siècle.<span class="element"></p></span>
<span class="element"></occupation></span>
<span class="comment"><!-- ... --></span>
<span class="element"></person></span></div></div><p class="box">L'élément <span class="gi"><person></span> (vel sim) ne contient pas une transcription, mais des annotations</p></div><div class="slide"><h2>Traits, états et événements</h2><p>Le variéte des informations que l'on pourrait souhaiter retenir pour une entité nommée est <em>vaste</em> -- et donc impossible de standardiser de manière exhaustive. La TEI fournit trois éléments génériques, et quelques-uns plus spécifiques.</p><p>Les elements génériques: </p><ul><li class="item"><span class="gi"><state></span> : des <span class="term">traits</span> : des caractéristiques qui en gros ne changent pas avec le temps</li><li class="item"><span class="gi"><trait></span> : des <span class="term">états</span> : des caractéristiques qui se maintiennent seulement pendant une durée définie</li><li class="item"><span class="gi"><event></span> : des <span class="term">événements</span> ou des incidents qui peuvent conduire à un changement d'état ou, moins fréquemment, à un changement de trait</li></ul></div><div class="slide"><h2>Les éléments plus spécifiqes</h2><p>Pour les personnes : </p><dl><dt><span>états</span></dt><dd>par ex <span class="gi"><occupation></span> le métier, <span class="gi"><residence></span> la résidence, <span class="gi"><education></span>,l'éducation</dd><dt><span>traits</span></dt><dd>par ex <span class="gi"><faith></span> la foi, <span class="gi"><sex></span> le sexe, <span class="gi"><socEcStatus></span>, le statut social</dd><dt><span>événements</span></dt><dd>par ex <span class="gi"><birth></span> la naissance, et <span class="gi"><death></span> la mort</dd></dl><p>Pour les lieux : </p><dl><dt><span>états</span></dt><dd>par ex <span class="gi"><terrain></span>, <span class="gi"><climate></span>, <span class="gi"><location></span>, <span class="gi"><population></span></dd><dt><span>noms (en ordre hiérarchique) </span></dt><dd>par ex <span class="gi"><bloc></span> (regroupement de pays), <span class="gi"><country></span> (pays ou unité administratif pareil), <span class="gi"><region></span> (sous-division administrative d'un pays), <span class="gi"><settlement></span> (lieu d'habitation), <span class="gi"><district></span> (sous-division de settlement)</dd></dl></div><div class="slide"><h2>Lieux</h2><p>Pour les lieux, la TEI prévoit plusieurs types de déscription :</p><ul><li class="item">le plus simple: nominatif <div id="index.xml-egXML-d30e818" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><place <span class="attribute">xml:id</span>="<span class="attributevalue">LYON</span>" <span class="attribute">type</span>="<span class="attributevalue">city</span>"></span>
<span class="element"><placeName <span class="attribute">xml:lang</span>="<span class="attributevalue">en</span>"></span>Lyons<span class="element"></placeName></span>
<span class="element"><placeName <span class="attribute">notAfter</span>="<span class="attributevalue">0056</span>"></span>Lugdunum<span class="element"></placeName></span>
<span class="element"><placeName <span class="attribute">notBefore</span>="<span class="attributevalue">1400</span>"></span>Lyon<span class="element"></placeName></span>
<span class="element"></place></span></div></li><li class="item">... ou bien en termes géopolitiques par rapport aux unités administratives <span class="gi"><bloc></span>, <span class="gi"><country></span>, <span class="gi"><region></span>, <span class="gi"><settlement></span>, <span class="gi"><district></span> etc <div id="index.xml-egXML-d30e846" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><place <span class="attribute">xml:id</span>="<span class="attributevalue">LYON</span>" <span class="attribute">type</span>="<span class="attributevalue">city</span>"></span>
<span class="element"><location></span>
<span class="element"><bloc></span>EU<span class="element"></bloc></span>
<span class="element"><country></span>France<span class="element"></country></span>
<span class="element"><region <span class="attribute">notAfter</span>="<span class="attributevalue">2016</span>"></span>Rhone-Alpes<span class="element"></region></span>
<span class="element"></location></span>
<span class="element"></place></span></div></li><li class="item">.. ou bien en termes de location physique <span class="gi"><geo></span> et <span class="gi"><offset></span> <div id="index.xml-egXML-d30e864" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><place <span class="attribute">xml:id</span>="<span class="attributevalue">LYON</span>" <span class="attribute">type</span>="<span class="attributevalue">city</span>"></span>
<span class="element"><location></span>
<span class="element"><geo></span>45.769559 4.834843<span class="element"></geo></span>
<span class="element"></location></span>
<span class="element"><location></span>
<span class="element"><offset></span>au confluent des<span class="element"></offset></span>
<span class="element"><geogName></span>Rhône<span class="element"></geogName></span>
<span class="element"><geogName></span>Saône<span class="element"></geogName></span>
<span class="element"></location></span>
<span class="element"></place></span></div></li></ul><p class="box">Notons que toutes ces données (même la dernière) sont des états -- elles peuvent changer avec le temps -- des attributs (<span class="att">notBefore</span> etc.) sont disponibles pour associer une information avec le temps</p></div><div class="slide"><h2>Regroupements et responsabilités</h2><p>On peut regrouper les entités dans une liste pour construire une espèce d'index :</p><div id="index.xml-egXML-d30e887" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><listPerson></span>
<span class="element"><head></span>Personnes citées dans ce document<span class="element"></head></span>
<span class="element"><person <span class="attribute">xml:id</span>="<span class="attributevalue">AA1873</span>"></span>
<span class="element"><persName></span>Anna Akhmetova<span class="element"></persName></span>
<span class="comment"><!-- ... --></span>
<span class="element"></person></span>
<span class="element"><person <span class="attribute">xml:id</span>="<span class="attributevalue">VM1893</span>"></span>
<span class="element"><persName></span>Vladimir Mayakovsky<span class="element"></persName></span>
<span class="comment"><!-- ... --></span>
<span class="element"></person></span>
<span class="element"></listPerson></span></div><p>Et pareillement on peut regrouper des <span class="gi"><place></span> dans une <span class="gi"><listPlace></span>, des <span class="gi"><event></span> dans un <span class="gi"><listEvent></span> etc.</p><div class="p">On peut indiquer l'agence responsable d'une annotation et sa certitude avec des attributs <span class="att">resp</span> et <span class="att">cert</span>, respectivement: <div id="index.xml-egXML-d30e921" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><org <span class="attribute">xml:id</span>="<span class="attributevalue">MXY</span>" <span class="attribute">type</span>="<span class="attributevalue">tribu</span>"
<span class="attribute">resp</span>="<span class="attributevalue">#herodote</span>"></span>
<span class="element"><orgName></span>Les Maxyens<span class="element"></orgName></span>
<span class="element"><country></span>Lybie<span class="element"></country></span>
<span class="element"><desc></span>Selon Hérodote, c'était une tribu de Lybie occidentale qui disait être la
descendante des Troyens<span class="element"></desc></span>
<span class="element"></org></span>
<span class="comment"><!-- ... dans le texte --></span>
<span class="element"><p></span> ... Il s'agit des <span class="element"><orgName <span class="attribute">resp</span>="<span class="attributevalue">#LB</span>" <span class="attribute">ref</span>="<span class="attributevalue">#MXY</span>" <span class="attribute">cert</span>="<span class="attributevalue">low</span>"></span>maxiliens<span class="element"></orgName></span> ... <span class="element"></p></span></div></div></div><div class="slide"><h2>Datation des propositions</h2><ul><li class="item">La plupart des informations associées avec une entité peut changer dans le temps</li><li class="item">par ex. occupation, adresse, mais aussi nom, affiliation réligieuse, sexe, etc.</li><li class="item">pour cette raison, tout élément déscriptif d'une entité est membre de la classe <span class="ident">att.datable</span> qui fournit plusieurs attributs utiles pour la normalisation des dates</li></ul><ul><li class="item"><span class="att">when</span> : date exacte. <div id="index.xml-egXML-d30e954" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><date <span class="attribute">when</span>="<span class="attributevalue">2012-10-02</span>"></span>Deux octobre 2012<span class="element"></date></span> ou
<span class="element"><date <span class="attribute">when</span>="<span class="attributevalue">1552</span>"></span>M.D.LII<span class="element"></date></span></div></li><li class="item"><span class="att">notBefore</span> : indique la date la plus antérieure possible <div id="index.xml-egXML-d30e965" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--> C’était <span class="element"><date <span class="attribute">notBefore</span>="<span class="attributevalue">2001</span>"></span>un ou deux ans<span class="element"></date></span> avant sa
naissance en <span class="element"><date <span class="attribute">when</span>="<span class="attributevalue">2003</span>"></span>2003<span class="element"></date></span>. </div></li><li class="item"><span class="att">notAfter</span> : indique la date la plus postérieure possible <div id="index.xml-egXML-d30e978" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely-->
Nous partirons d’ici <span class="element"><date <span class="attribute">notAfter</span>="<span class="attributevalue">2012-03-31</span>"></span>deux mois maximum<span class="element"></date></span>
à partir de <span class="element"><date <span class="attribute">when</span>="<span class="attributevalue">2012-01-31</span>"></span>ce jour<span class="element"></date></span>. </div></li></ul></div><div class="slide"><h2>Autres calendriers</h2><p>L'attribut <span class="att">calendar</span> sert à indiquer le calendrier dans lequel une date est exprimée</p><div id="index.xml-egXML-d30e995" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><date <span class="attribute">calendar</span>="<span class="attributevalue">#cal_AH</span>" <span class="attribute">when</span>="<span class="attributevalue">0676-06-08</span>"></span>20 Rajab, 56<span class="element"></date></span>
<span class="comment"><!-- implique une définition dans l'entête par ex --></span>
<span class="element"><calendarDesc></span>
<span class="element"><calendar <span class="attribute">xml:id</span>="<span class="attributevalue">cal_AH</span>"></span>
<span class="element"><p></span>Anno Hegirae (Muhammedan Era)<span class="element"></p></span>
<span class="element"></calendar></span>
<span class="element"></calendarDesc></span></div><p class="box">Par défaut les dates sont normalisées par rapport au calendrier chrétien gregorien; l'attribut <span class="att">custom-when</span> permet l'indication d'une normalisation par rapport au calendrier spécifié.</p></div><div class="slide"><h2>Epoques historiques</h2><div class="p">On peut définir un <span class="gi"><period></span> (époque) et référer à cela de la même manière : <div id="index.xml-egXML-d30e1016" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><placeName <span class="attribute">period</span>="<span class="attributevalue">#hellenistic</span>"></span>Stauropolis<span class="element"></placeName></span>
<span class="comment"><!-- nécessite une définition dans l'entête par ex --></span>
<span class="element"><category <span class="attribute">xml:id</span>="<span class="attributevalue">hellenistic</span>"></span>
<span class="element"><catDesc></span>
<span class="element"><ref <span class="attribute">target</span>="<span class="attributevalue">http://www.wikipedia.com/wiki/Hellenistic</span>"></span>Hellenistic<span class="element"></ref></span>: Se dit de
la periode <span class="element"><date <span class="attribute">notBefore</span>="<span class="attributevalue">-0323</span>" <span class="attribute">notAfter</span>="<span class="attributevalue">-0031</span>"></span>après la mort d'Alexandre
jusqu'au <span class="element"><date <span class="attribute">when</span>="<span class="attributevalue">-146</span>"></span>conquête romaine<span class="element"></date></span>
<span class="element"></date></span>
<span class="element"></catDesc></span>
<span class="element"></category></span></div></div><div class="p">ou, plus directement, <div id="index.xml-egXML-d30e1032" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><placeName <span class="attribute">period</span>="<span class="attributevalue">http://www.wikipedia.com/wiki/Hellenistic</span>"></span>Stauropolis<span class="element"></placeName></span></div></div></div><div class="slide"><h2>Vers le "placeography"</h2><p>Par exemple: le lieu de naissance de Mayakovsky </p><div id="index.xml-egXML-d30e1040" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><place <span class="attribute">xml:id</span>="<span class="attributevalue">BGDT</span>"></span>
<span class="element"><placeName <span class="attribute">xml:lang</span>="<span class="attributevalue">ka</span>"></span>ბაღდათი<span class="element"></placeName></span>
<span class="element"><placeName <span class="attribute">xml:lang</span>="<span class="attributevalue">en</span>"></span>Baghdati<span class="element"></placeName></span>
<span class="element"><placeName <span class="attribute">notAfter</span>="<span class="attributevalue">1990</span>"
<span class="attribute">notBefore</span>="<span class="attributevalue">1940</span>" <span class="attribute">xml:lang</span>="<span class="attributevalue">ru</span>"></span>Маяковский<span class="element"></placeName></span>
<span class="element"><location <span class="attribute">type</span>="<span class="attributevalue">geopolitical</span>"></span>
<span class="element"><country></span>Georgia<span class="element"></country></span>
<span class="element"><region></span>Imereti<span class="element"></region></span>
<span class="element"></location></span>
<span class="element"><location <span class="attribute">type</span>="<span class="attributevalue">physical</span>"></span>
<span class="element"><offset></span>West of<span class="element"></offset></span>
<span class="element"><placeName></span>
<span class="element"><geogFeat></span>River<span class="element"></geogFeat></span>
<span class="element"><geogName></span>Khanistskali<span class="element"></geogName></span>
<span class="element"></placeName></span>
<span class="element"><geo></span>42.102298,42.832947<span class="element"></geo></span>
<span class="element"></location></span>
<span class="element"><population <span class="attribute">when</span>="<span class="attributevalue">2007</span>"></span>
<span class="element"><p></span>4,700 people<span class="element"></p></span>
<span class="element"></population></span>
<span class="element"></place></span></div><p class="box">Les éléments TEI prévus pour l'encodage des entités ressemblent plus aux notices textuelles qu'aux données structurées. Ils sont (apparemment) destinés à être lus par un humain et non pas par un automat. </p></div><div class="slide"><h2>Les relations entre les lieux</h2><p>La TEI propose des méthodes simples pour indiquer </p><ul><li class="item">des relations de synomonie</li><li class="item">des relations hiérarchiques</li></ul><div id="index.xml-egXML-d30e1078" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><place <span class="attribute">xml:id</span>="<span class="attributevalue">LT</span>"></span>
<span class="element"><country></span>
<span class="element"><placeName <span class="attribute">xml:lang</span>="<span class="attributevalue">lt</span>"></span>Lietuva<span class="element"></placeName></span>
<span class="element"><placeName <span class="attribute">xml:lang</span>="<span class="attributevalue">fr</span>"></span>Lituanie<span class="element"></placeName></span>
<span class="element"><placeName <span class="attribute">xml:lang</span>="<span class="attributevalue">en</span>"></span>Lithuania<span class="element"></placeName></span>
<span class="element"></country></span>
<span class="element"><place <span class="attribute">xml:id</span>="<span class="attributevalue">LT-VN</span>"></span>
<span class="element"><settlement></span>Vilnius<span class="element"></settlement></span>
<span class="element"></place></span>
<span class="element"><place <span class="attribute">xml:id</span>="<span class="attributevalue">LT-KA</span>"></span>
<span class="element"><settlement></span>Kaunas<span class="element"></settlement></span>
<span class="element"></place></span>
<span class="element"></place></span></div><p class="box">... mais comment indiquer d'autre relations, par ex <span class="q">‘Vilnius est la capitale de Lietuva’</span> ou <span class="q">‘Kaunas est loin de Vilnius’</span> ?</p></div><div class="slide"><h2>Les relations personnelles</h2><ul><li class="item"><span class="gi"><relation></span> (relationship) est concu pour décrire une relation parmi des personnes spécifiques <dl><dt><span><span class="att">name</span></span></dt><dd>fournit un nom pour le type de relation dont elle est une instance.</dd><dt><span><span class="att">active</span></span></dt><dd>identifie les personnes actives dans une relation non-mutuelle (par ex. le père et la mère dans la relation "ancêtre de")</dd><dt><span><span class="att">passive</span></span></dt><dd>identifie les personnes <span class="q">‘passives’</span> dans une relation non-mutuelle (par ex les enfants dans la relation "ancêtre de")</dd><dt><span><span class="att">mutual</span></span></dt><dd>identifie toutes les personnes concernées par une relation réciproque (par ex les frères et les soeurs dans la relation "même-génération") </dd></dl></li></ul></div><div class="slide"><h2>Exemples</h2><div id="index.xml-egXML-d30e1145" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><person <span class="attribute">xml:id</span>="<span class="attributevalue">jsbach</span>"></span>
<span class="element"><persName></span>Johann Sebastian Bach<span class="element"></persName></span>
<span class="element"></person></span>
<span class="element"><person <span class="attribute">xml:id</span>="<span class="attributevalue">mbbach</span>"></span>
<span class="element"><persName></span>Maria Barbara Bach<span class="element"></persName></span>
<span class="element"></person></span>
<span class="element"><person <span class="attribute">xml:id</span>="<span class="attributevalue">cdbach</span>"></span>
<span class="element"><persName></span>Catharina Dorothea Bach<span class="element"></persName></span>
<span class="element"></person></span>
<span class="element"><person <span class="attribute">xml:id</span>="<span class="attributevalue">ghbach</span>"></span>
<span class="element"><persName></span>Gottfried Heinrich Bach<span class="element"></persName></span>
<span class="element"></person></span>
<span class="comment"><!--….--></span>
<span class="element"><relation <span class="attribute">type</span>="<span class="attributevalue">marriage</span>"
<span class="attribute">mutual</span>="<span class="attributevalue">#jsbach #mbbach</span>" <span class="attribute">from</span>="<span class="attributevalue">1707</span>" <span class="attribute">to</span>="<span class="attributevalue">1720</span>"/></span>
<span class="element"><relationGrp <span class="attribute">type</span>="<span class="attributevalue">children</span>"
<span class="attribute">subtype</span>="<span class="attributevalue">first-marriage</span>"></span>
<span class="element"><relation <span class="attribute">name</span>="<span class="attributevalue">parent</span>" <span class="attribute">active</span>="<span class="attributevalue">#jsbach</span>"
<span class="attribute">passive</span>="<span class="attributevalue">#cdbach</span>"/></span>
<span class="comment"><!--….--></span>
<span class="element"></relationGrp></span>
<span class="element"><relationGrp <span class="attribute">type</span>="<span class="attributevalue">children</span>"
<span class="attribute">subtype</span>="<span class="attributevalue">second-marriage</span>"></span>
<span class="element"><relation <span class="attribute">name</span>="<span class="attributevalue">parent</span>" <span class="attribute">active</span>="<span class="attributevalue">#jsbach</span>"
<span class="attribute">passive</span>="<span class="attributevalue">#ghbach</span>"/></span>
<span class="comment"><!--….--></span>
<span class="element"></relationGrp></span></div><p class="box">L'élément <span class="gi"><relation></span> pourrait également servir à représenter des relations entre lieux :</p><div id="index.xml-egXML-d30e1171" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><relation <span class="attribute">type</span>="<span class="attributevalue">capitalCity</span>"
<span class="attribute">active</span>="<span class="attributevalue">#LT-VN</span>" <span class="attribute">passive</span>="<span class="attributevalue">#LT</span>"/></span>
<span class="element"><relation <span class="attribute">type</span>="<span class="attributevalue">farApart</span>"
<span class="attribute">mutual</span>="<span class="attributevalue">#LT-VN #LT-KA</span>"/></span></div></div><div class="slide"><h2>N'oublions pas qu'un nom peut être considéré un entité!</h2><p>Pour certaines raisons (onomastique, étymologie...) les noms propres existent indépendamment de leur relation à une entité.</p><p>Les éléments <span class="gi"><nym></span> et <span class="gi"><listNym></span> peuvent être utilisés pour rappeler une information concernant un nom considéré comme une entité, et l'attribut <span class="att">nymRef</span> peut être utilisé pour lui associer le ou les noms..</p><div id="index.xml-egXML-d30e1190" class="pre egXML_valid"><!--This otherwise redundant comment ensures egXMLs format nicely--><span class="element"><nym <span class="attribute">xml:id</span>="<span class="attributevalue">VLAD</span>"></span>
<span class="element"><nym></span>
<span class="element"><form <span class="attribute">xml:lang</span>="<span class="attributevalue">ru</span>"></span>Владимир<span class="element"></form></span>
<span class="element"><etym></span>from <span class="element"><lang></span>Slavonic<span class="element"></lang></span> Влад (rule) + мѣр (fame), changed by folk
etymology into мир (world)<span class="element"></etym></span>
<span class="element"><nym></span>
<span class="element"><form></span>Vlad<span class="element"></form></span>
<span class="element"></nym></span>
<span class="element"><nym></span>
<span class="element"><form></span>Volodya<span class="element"></form></span>
<span class="element"></nym></span>
<span class="element"></nym></span>
<span class="element"><nym></span>
<span class="element"><form <span class="attribute">xml:lang</span>="<span class="attributevalue">da</span>"></span>Valdemar<span class="element"></form></span>
<span class="element"></nym></span>
<span class="element"><nym></span>
<span class="element"><form <span class="attribute">xml:lang</span>="<span class="attributevalue">de</span>"></span>Waldemar<span class="element"></form></span>
<span class="element"></nym></span>
<span class="element"></nym></span>
<span class="element"><forename <span class="attribute">type</span>="<span class="attributevalue">first</span>" <span class="attribute">nymref</span>="<span class="attributevalue">#VLAD</span>"></span>Владимир<span class="element"></forename></span></div></div><div class="slide"><h2>Quoi faire avec toutes ces balises?</h2><ul><li class="item">on peut extraire ses propres indexes : simple affaire de transformation </li><li class="item">on peut construire une cartographie </li><li class="item">on peut entrelacer ses données avec celles d'autres </li></ul><p class="box">Exemples : le projet ReNom ; le projet Pelagios ; le projet MoEML</p></div><div class="slide"><h2>Index des personnes : exemple</h2><div class="figure"><img src="media/avicenne.png" alt="" class="graphic" style=" width:80%;"></img><h2><a class="link_ptr" href="https://renom.univ-tours.fr/fr/index/personnes/avicenne"><span>https://renom.univ-tours.fr/fr/index/personnes/avicenne</span></a></h2></div></div><div class="slide"><h2>Comment effectuer ce balisage ? </h2><p>Rappel: il nous faut des moyens ...</p><ul><li class="item">d'identifier automatiquement les phrases nominatives</li><li class="item">de retrouver ces phrases dans des référentiels appropriés</li><li class="item">et ainsi de désambiguïser les références</li></ul><p>La reconnaissance automatique des <span class="q">‘entités nommées’</span> -- NER -- est devenu une application classique dans le domaine de TAL</p><p>Les référentiels se prolifèrent en format "linked open data" (LOD)</p><p class="box">Outil typique de cet approche: <a class="link_ref" href="http://recogito.pelagios.org">Recogito</a></p><p>Voir le tutoriel <span class="titlem">Données liées et annotation de corpus</span> de Francesca Frontini (CAHIER, Montpellier, 2018)</p></div><div class="slide"><h2>Quid de RDF et LOD?</h2><ul><li class="item">RDF (Resource Description Framework) est un standard W3C tres répandu, visant la définition de la sémantique d'une ressource numérique </li><li class="item">RDF dispose d'une représentation très simple (si verbose) composée de "triples" <ul><li class="item">un triple comporte trois URI <ul><li class="item">sujet : de quoi s'agit-il? (par ex "Vilnius")</li><li class="item">predicat : catégorie identifiée (par ex "capital-of")</li><li class="item">objet : valeur du catégorie ("par ex "Lituanie")</li></ul></li><li class="item">Les catégories sont d'habitude sélectionnées dans une <span class="term">ontologie</span> spécifique</li></ul></li><li class="item">LOD (Linked Open Data) est un mode d'édition de ressources numériques ouvertes, qui disposent d'une déscription exprimée en RDF </li><li class="item">Ces deux acronymes sont au coeur de l'évolution du web actuel (le web de documents) vers le "semantic web" (le web de données)</li></ul><div class="figure"><img src="media/goto-rdf-1.png" alt="" class="graphic"></img></div></div><div class="slide"><h2>Comment intégrer RDF en TEI ?</h2><p>La TEI partage les objectifs fédératifs et "open" de LOD. Mais sa sémantique est plus dispersée. Elle ne simplifie pas les documents : on peut la lui reprocher, mais la sémantique d'un ensemble de documents TEI est souvent dispersée dans son balisage d'une manière peu cohérente. </p><p>Par contre, la sémantique d'une page web qui fournit par ex. les prix, les détails téchniques, les couleurs disponibles, etc pour un gadget quelconque peut facilement être extraite, et en l'exprimant, on exprime toute la portée de ce page. </p><p>On peut s'imaginer plusieurs méthodes pour intégrer une description RDF dans un document TEI </p><ul><li class="item">directement, en utilisant l'espace de noms RDF</li><li class="item">en utilisant l'element <span class="gi"><relation></span></li><li class="item">en utilisant les attributs RDFa</li><li class="item">en utilisant/abusant l'élément <span class="gi"><graph></span>, ou <span class="gi"><link></span>, ou <span class="gi"><fs></span></li></ul><p class="box">Ca se discute depuis 2013... pour une synthèse récente, voir <a class="link_ptr" href="https://github.com/TEIC/TEI/issues/1860"><span>https://github.com/TEIC/TEI/issues/1860</span></a></p></div><div class="slide"><h2>A la recherche d'une ontologie TEI</h2><ul><li class="item">Depuis longtemps, on propose de surajouter aux définitions des éléments TEI une représentation de leur sémantique </li><li class="item">par ex, dans l'élément <span class="gi"><equiv></span>, ou en élargissant la système de classes actuelle</li><li class="item">et/ou en définissant une "vraie" ontologie par ex en OWL, ou d'autre formalisme à la mode </li></ul><p class="box">c'est bien possible... mais la TEI est conçue pour les documents, et les documents ne sont pas des ensembles de données abstraites ou objectives. </p><p>Un document doit etre interprété: il faut compléter sa modélisation avec son/ses interpretation/s... </p></div><div class="slide"><h2>Science de texte: science de données</h2><p class="box">... et de même pour les données!</p><p>Il ne faut pas sous-estimer l'importance du contexte de production/consommation des données, non plus. </p><blockquote class="quote"><p>All data is historical data: the product of a time, place, political, economic, technical, & social climate. If you are not considering why your data exists, and other data sets don’t, you are doing data science wrong” </p></blockquote><blockquote class="quote"><p>Les données ont toujours un aspect historique - elles ressortent d'un temps, d'un endroit, ou d'un climat socio-économique spécifique. Si vous ne mettez pas en question les raisons pour lesquelles vos données à vous existent et d'autres sont disparues, alors vous pratiquez incorrectement la science de données</p></blockquote><p>[Melissa Terras, Opportunities, barriers, and rewards in digitally-led analysis of history, culture and society. Turing Lecture 2019-03-03, <a class="link_ptr" href="https://www.youtube.com/watch?v=bf6DsJ7VcLI"><span>https://www.youtube.com/watch?v=bf6DsJ7VcLI</span></a>]</p><p class="box"><span class="quote">‘Text is not a special kind of data: data is a special kind of text’</span></p></div></body></html>