%0 Journal Article %T Annotations en cha nes de cor¨¦f¨¦rences et anaphores dans un corpus de discours spontan¨¦ en fran ais %A Muzerelle Judith %A Schang Emmanuel %A Antoine Jean-Yves %A Eshkol Iris %J SHS Web of Conferences %D 2012 %I %R 10.1051/shsconf/20120100252 %X Cet article pr¨¦sente une analyse des relations anaphoriques d¡¯un corpus de dialogue oral spontan¨¦ en fran ais. Au cours des deux derni¨¨res d¨¦cennies, l¡¯ing¨¦nierie des langues a connu des avanc¨¦es spectaculaires qui ont permis l¡¯¨¦mergence de nombreuses applications op¨¦rationnelles destin¨¦es aussi bien au grand public qu¡¯aux professionnels. Parmi ces technologies langagi¨¨res, la recherche d¡¯information et l¡¯indexation de documents constituent sans nul doute un des champs applicatifs promis ¨¤ un bel avenir. En effet, la croissance exponentielle des ressources textuelles ou multim¨¦dias accessibles sur Internet n¨¦cessite la mise en place d¡¯outils de structuration et d¡¯interrogation automatique intelligents. Par exemple, la quasi-int¨¦gralit¨¦ des articles publi¨¦s sur Internet par les quotidiens de la presse nationale ou r¨¦gionale font l¡¯objet d¡¯une indexation automatique. L¡¯importance de la r¨¦solution des anaphores pour les technologies langagi¨¨res a conduit ¨¤ l¡¯¨¦mergence de nombreux travaux qui ont fait l¡¯objet de campagnes d¡¯¨¦valuation internationales (MUC et SemEval) ou nationales (DEFT) au cours de la derni¨¨re d¨¦cennie. Ces recherches ont toutefois port¨¦ majoritairement sur des documents ou des messages ¨¦lectroniques (langage ¨¦crit). A l¡¯oppos¨¦, la communaut¨¦ parole s¡¯est surtout focalis¨¦e sur la probl¨¦matique de l¡¯anaphore pronominale, tr¨¨s pr¨¦sente en dialogue oral homme-machine (serveurs vocaux interactifs). La particularit¨¦ de notre corpus se situe donc dans son caract¨¨re oral et dans le type des entit¨¦s annot¨¦es (groupes nominaux et pronoms). Les avanc¨¦es continues du traitement de la parole (reconnaissance vocale en particulier) am¨¨nent d¨¦sormais les chercheurs ¨¤ s¡¯int¨¦resser ¨¤ une recherche d¡¯information dans des flux oraux ou vid¨¦os (¨¦missions radio ou t¨¦l¨¦diffus¨¦es par exemple) ¨¦quivalente ¨¤ celle r¨¦alis¨¦e sur les documents ¨¦lectroniques. Dans cette perspective, il est essentiel de d¨¦velopper des techniques capables de traiter toutes les formes d¡¯anaphores de l¡¯oral spontan¨¦. Ainsi, cet article exposera plus particuli¨¨rement l¡¯¨¦tude pilote CO2, qui a conduit ¨¤ une proc¨¦dure d¡¯annotation de corpus, puis deux exp¨¦riences issues du corpus annot¨¦ (l'accord en genre et en nombre, et la descriptions des d¨¦finis en premi¨¨re mention), et enfin les travaux ¨¤ venir du projet ANCOR. L¡¯objectif de celui-ci est d¡¯¨¦valuer la pertinence et de mod¨¦liser les processus de r¨¦solution de ces anaphores complexes en discours spontan¨¦. Le corpus du projet ANCOR sera, ¨¤ terme, le plus volumineux corpus de fran ais parl¨¦ annot¨¦ en anaphores. %U http://dx.doi.org/10.1051/shsconf/20120100252