Partielo | Créer ta fiche de révision en ligne rapidement
Post-Bac
4

Ressources numérique

    I.       Ressources numériques pour la recherche d’information : terminologie et documentation spécialisée

1.   Traducteur et internet

 

Les recherches menées sur internet pour se familiariser avec un sujet spécialisé (acquérir de connaissance sur ce sujet et appropriation de terminologie et phraséologie il y a une étape à travers base de données, dictionnaires, consulter des ressources et des outils basés sur le corpus.

 

En parallèle des ressources du client (références, glossaires, mémoire de traduction)

 

Du général …. Vers un caractère plus spécialisé Eg Google (recherche simple et avancée pour avoir les opérateurs de recherche. On peut déjà affiner les requêtes pour spécifier certaines éléments (filetype pour fichier pdf par exemple)

 

Le paramètre s’opère via des opérateurs (pour une expression exactes « utilisation des guillemets » pour faire une hypothèse de traduction par rapport au mots exa, cibler nos requêtes pour en préciser le résultat.

 

Opérateurs booléens

 

Une image contenant texte, affichage, Appareil de présentation, multimédia

Description générée automatiquement

 

Guillemet : «. » c’est bien mais après il faut regarder la source.

 

 

Casse : les majuscules et minuscules isn’t important

 

Joker : * pour remplacer un mot dans une expression. On peut intégrer formuler une hypothèse de traduction Une image contenant texte, intérieur, mur, tableau blanc

Description générée automatiquementCe n’est pas exhaustif

Google advanced search/ identifier des spécialistes et après =>

Google scholar : article scientifique, littérature de rang universitaire, article de recherches, revues (fiable)

 

Wikipedia, alimenter par les experts mais aussi les non-expert. Les articles sont rédigés indépendamment dans les langues donc sans traduction. Sources primaires ( très important et gage de serieux)

 

2.   Recherche lexicologique et terminologique sur internet

 

Lexicologie : la science du lexique

Terminologie : la science des termes (domaines spec,connaissance spec)

 


Moteurs de recherche

Recherche avancée Google

Google Scholar ( simple ou avancé)

Encyclopedia Britannica | Britannica

Encyclopædia Universalis

Wikipedia : oui mais valide le doc pls : croise les infos, retournes aux sources et évalue les.

Beluga, votre outil de recherche - Bibliothèques universitaires - Université Grenoble Alpes (univ-grenoble-alpes.fr) : collections numérique et fait tes recherches, met un accent sur bases essentielles

Documentation scientifique et technique, conseil et formation | Techniques de l’Ingénieur (grenet.fr) pour le français et hésite pas à te faire une base de données en creant un corpus


Pour le français : https://petitrobert-lerobert-com.sid2nomade-1.grenet.fr/

Science Direct.com ScienceDirect.com | Science, health and medical journals, full text articles and books.

PubMed PubMed (nih.gov) bio medical

Hal.science Accueil - Archive ouverte HAL : science ouverte


A market of black boxes: The political economy of Internet surveillance and censorship in Russia - Archive ouverte HAL civilisation russe


Dictionnaire


Oxford Learner’s dictionary : Oxford Advanced Learner's Dictionary at Oxford Learner's Dictionaries | Find meanings and definitions of words (oxfordlearnersdictionaries.com)


Longman Dictionary of Contemporary English | LDOCE (ldoceonline.com)

Cambridge Dictionary | English Dictionary, Translations & Thesaurus

Ressources du Français :

1.   TLFi (atilf.fr) :          pour résoudre un problème de vocabulaire, de consulter le dictionnaire en ligne Trésor de la Langue Française:

Peindre les objets suivants : pour mettre en lumière les catégories que tu peux filtrer

2.   EGF-Accueil (encyclogram.fr) une encyclopédie, porte sur la grammaire du français d’une manère assez large ( outils pedagogique et viens en complément du tlfi et academie fr

3.   Orthonet : http://orthonet.sdv.fr/ pour résoudre un problème d’orthographe, de consulter le site

4.   L'Académie Française: http://academie-francaise.fr/la-langue-francaise/questions-de-langue

5.   Dictionnaire de synonyme : CRISCO - Dictionnaire des synonymes (unicaen.fr) : traduire ou rédiger*

6.   Les Atlas sémantiques, dictionnaire de synonymes et traduction (atlas-semantiques.eu) proximité des mots en eux, fiches et cartes

7.   Centre National de Ressources Textuelles et Lexicales (cnrtl.fr) un outil

Terminologies | ORTOLANG

8.   Traduction gratuite en ligne | Lexicool annuaire de dico


Pour le français : https://petitrobert-lerobert-com.sid2nomade-1.grenet.fr/

LEXILOGOS - Dictionnaires, Cartes, Livres en ligne - Langues & pays du monde : français et russe

Unilingue d’abord et multilingue après

 

Banque de donnée terminologique

1.   IATE : créé pour les traducteurs de la commission européenne (en ligne depuis 2007)

Open expanded search

2.   TErmiumPlus : figure en terminologie (Montréal, pour le fr et eng)

2 elm SOURCE =>production de document fiable et facilitation de traduction POUR LES langueS de l’ALENA

3.   FranceTerme

4.   GDT Vitrine linguistique : La Vitrine linguistique de l’Office québécois de la langue française (gouv.qc.ca) GDT OU BDL (DEPANNAGE LINGUISTIQUE)

Outils d’aide à la rédaction

Outils d’aide à la rédaction – Ressources du Portail linguistique du Canada – Langues – Identité canadienne et société – Culture, histoire et sport – Canada.ca (noslangues-ourlanguages.gc.ca)

Dictionnaire de coocurences : permet d’accéder à des ensembles de mot avec un certain affinité

Juridictionnaire

Guide du rédacteur

WIPO PEARL / WIPO Pearl – WIPO’s Multilingual Terminology Portal

¾ validé et 4/4 validé par l’expert

FranceTerme : En lien avec dispositif enrichissement langue française

Loic depecker

Société française de terminologie : asso savante créé pour diffuser des infos sur la terminologie : certains nombres d’informations dessus

·        Promouvoir+soutenir des actions en matière de terminologie et domaine associés

·        Une rubrique : viens de paraître :Commission d'enrichissement de la langue française qui s’appuie sur des experts / pour normaliser les termes de la terminologie issue de la La délégation générale à la langue française et aux langues de France (culture.gouv.fr) dépends ministère de la culture, ils ont des terminologue et eux travaillent avec la Commission d'enrichissement de la langue française

Ex : vocabulaire de l’environement Légifrance - Publications officielles - Journal officiel - JORF n° 0123 du 28/05/2023 (legifrance.gouv.fr) issue du journal officiel

désimperméabilisation des sols

Domaine : AMÉNAGEMENT ET URBANISME-ENVIRONNEMENT.

Définition : Suppression du matériau de recouvrement imperméable d’un sol ou remplacement de ce dernier par un autre matériau, perméable.

Note : La désimperméabilisassions des sols contribue d’une part à réduire le ruissellement des eaux, et donc le risque d’inondation, d’autre part à favoriser leur infiltration et ainsi le rechargement des nappes phréatiques. V

oir aussi : artificialisation des sols, imperméabilisation des sols.

Équivalent étranger : –

Recommandations fait sur des sigles : pour normaliser des termes

Les organismes ont leurs portails terminologiques

Pour les projets de traduction, n’hésitez pas à voir sur les thématiques avec le domaine et objet de votre texte

Ex : PORTAIL TERMINOLOGIQUE DE LA FAO | Organisation des Nations Unies pour l'alimentation et l'agriculture


Terminologie et outils : liste des portails terminologique

En particulier :

Recueils de terminologie officielle sur Franceterme

De TermSciences à Loterre: des terminologies partagées - Inist : LOTERRE - Linked Open TERminology REsources - Accueil

PORTAILS TERMINOLOGIQUES on peut naviguer

terminologie et traduction

bases/banques de DONNEES TERMINOLOGIQUE


Term bank

Term bases

Terminologues

Traducteurs (ex : faire appel à une bases de donnéees multiterm alimenté par des trad)

Projet terminoik (IATE, wipopearl)

Approche trad individuelle/isolées

Ficher termino

Description des concepts structurant un domaine spécialisé (banque de donnée de lOMPI

Contenu appliqué à la résolution de prob en trad (équivalents et collocations)

Exhaustivité des données (champs de la fiche) gdt (les données ne sont pas exhau de façon systématique mais elle tend à avoir le meême type de contenu

Données fragmentaires qui vont permettre à répondre à un besoin

Termino thématique

Terminologie ponctuelle, ad hoc (quand on est dans un projet, on cherche à def les thématik)

Sources monolingues (contrôles stricts des sources) : ce sont les 1 er matériaux de travail, pas à partir d’une source traduite.

Corpus comparable

Monolingue et bilingues

(Concordancier en ligne et des bases de données en ligne, TA)



Corpus parallèles

Outil indépendant : ils ont leur propres autonomie

Outils intégré dans les environnement de travail en traduction (Translation Environment tools ( TenTs)

Approche onomasiologique (fondé sur un concept) est remodelé, refaçonné pour s’intéresser au terme et après le concept alors qu’à la base c’est l’inverse

Hybride (onomasiologique et sémasiologique)


L’introduction à la corpus : traduction specialisée et terminologie

TYPE DE CORPUS APPORT DE CORPUS

      I.           DEFINITION ET TYPE DE CORPUS

Un corpus : ensemble de texte sous format électronique exploitable de façon automatique ou semi-automatique, assemblée spécifiquement sur l’analyse linguistique selon des critères spécifiques.

Le corpus : not an vault/archive or a library

App basée sur corpus :

·        En lexicographie : tradition anglosaxon : dictionnaire pour apprenant conçu en s’appuyant sur corpus ( ex : Cobuilt : burmingame collection of text)

·        Dictionnaire frequentielle qui prend en compte la frequence ( de l’espagnol = l’importance de se basée sur l’usage pour pouvoir decider si on veut integrer un mot dans le dico.

·        Terminographie : concevoir des dicos, vocab, s’appuie sur les corpus à travers les outils comme les logiciels extractions automatiques terminologique, les textes sont extraits de ces corpus et les terminographe choisisse diff termes pour les intégrer dans leurs ressources

·        Mémoire de traduction : créer à partir de textes sources cibles, mais se combine des segmentations

Définir les différents types de corpus :

Monolingue : corpus 1 langues

Bilingue : 2 langues

Multilingue : 3 langues

A partir de là, on peut créer un corpus comparable

        A collectionn of texts composed independendly in the repective languages and put together on the basis of similarity of content domain and communicative function. Zanettin 1998

 et parallèles

Parallel corpora have components in two or more languages consisting of original texts and their translations. Aston 1999

Corpus de référence

Corpus représentatif d’une langue, pour faire une generalisation sur le fonctionnement d’une langue

Contient des données écrites orales différents types de texte

Ex :

British National Corpus

Corpus of contemporary American English

CREA

Dereko

Corpus spécialisé

Corpus contenant des données sur un aspect d’une partie des langues

Ex :

Variété de langue (anglais britanik, anglais americain)

Langue utilisée par un groupe de locuteurs (ex adolescents)

Type de texte (ex SMS)

Langues spécialisée liée à un dom de connaissances (ce qui nous intéresse)

Corpus utilisés pour décrire un domaine de spécialité

Methodo de constitut°

ü Manuel (recherche docu) voir 1 ere partie du cours

Critère de sélection :

Langue, taille, nombre de textes, intégralités ou portions, support, domaine de spécialité, type de texte, niveau de spec, date de publicat°

ü Automatique (outils en ligne ex : SketchEngine : Create and search a text corpus | Sketch Engine)

Utilisation d’un corpus pour la trad, WHY ?

Comprendre un texte en langue source (lecture dans la langue cibles)

Acquérir des connaissances sur les concepts clé d’un domaine (connaissance dont j’ai besoin pour restituer le sens)

Identifier des termes spécialisés

Utilisation de concordanciers (+/_ outils d’extraction automatique de terminologie

Identifier des équivalents de traduction (lingue, concept mais mis en langue différemment)

Identifier des termes proches sémantiquement

Pouvoir extraire des collocations

           Ex : there are some clouds, there are a few clouds, it’s a bid cloudy

Corpûs de prevision meteorologique partly cloudy (Pearson 2002)

Constituer des fiches terminoik

           Extraire des « contextes riches en connaissances » ( knowledge rich context KRC : (PDF) How the Notion of “Knowledge Rich Context” Can Be Characterized Today (researchgate.net))identifier le plus automatiquement possible pour apporter des connaissances au traducteurs.

           Extraire des infos de nature conceptuelle et linguistique

Corpus parallèle

Corpus traduit qui peut être comparable à linguee tardooit Reverso contexct mais d’avantage construits

De taille moyenne, spécialisé

Exemples :

EMEA : European Medicines Agency | (europa.eu)

Eur-lex

EuroParl

   II.           Outils d’exploitation des corpus

Corpus stocké sous format électronique

Pour être manipulable par ordinateur

Et pour être exploitable par des outils informatisés conçus pour l’analyse de corpus.


Affichage KWIC

Fréquence d’utilisation, nombre d’occurrence

Un corpus nous aide à distinguer le sens d’un mot

Concordanciers

Concordancier monolingue

           Corpus comparable

Concordancier bilingue

           Corpus parallèle/corpus de traductions

CORPUS ALIGN2 5 ALIGNEMENT PHRASTIQUE°

Concordancier en ligne

Concordancier A télécharger

Ex : AntConc (travailler avec mon propre corpus)

A télécharger : Télécharger AntConc pour Windows, Mac, iOS, Android, Linux - Telecharger.com (01net.com)

Concordancier en ligne (comment je contrôle mes corpus)

Recherche toutes les occurrences d’un mot (ou d’une expression) et les font apparaitre dans leurs contextes

Environnement linguistique du mot recherché (mot à droite mot à gauche)

Recherches dans un corpus défini (Web)

Verbe : produire des concordances (to concordance)

Ex : WebCorp: The Web as Corpus (.edu . org blabla)

Limites : corpus contraints (bases textuelles prédéfinis)

Contrôle des paramètres du corpus

 III.           Outils d’exploitation de corpus étiquetés/annotés


Corpus dans lequelle à chaque mot du corpus sont étiquetés (grammaticales)

Corpora are useful only if we can extracty knowlegde in information from them. The fact is that to extract information from a corpus, we often have to begin by building information in it

ü Etiquetage morphosynthaxique (POS tagging)

Attribuer un cat grammatical à chaque mot d’un corpus (utile pour chercher une suite de mots)

Nom, verbe, adjectif, etc

Utile pour chercher des suites de mots

Ex : downturn, upturn (verbs)

ü Lemmatisation (LemME, c’est la forme canonique)

Regrouper l’ensemble des formes d’un mot donné

           Singulier et pluriel pour les noms et adjectifs

           Différentes formes fléchies pour les verbes

Ex : processing, processed, processes, processs

Attribuer un lemme

           Forme canonique

Ex : processing | ed |es |process>process

ü Annotation syntaxique (outils : analyseur syntaxique, pour désambigüisé )

Identifier et attribuer les relations syntaxiques des mots entre eux

Ex : Sujet, verbe, COD


Post-Bac
4

Ressources numérique

    I.       Ressources numériques pour la recherche d’information : terminologie et documentation spécialisée

1.   Traducteur et internet

 

Les recherches menées sur internet pour se familiariser avec un sujet spécialisé (acquérir de connaissance sur ce sujet et appropriation de terminologie et phraséologie il y a une étape à travers base de données, dictionnaires, consulter des ressources et des outils basés sur le corpus.

 

En parallèle des ressources du client (références, glossaires, mémoire de traduction)

 

Du général …. Vers un caractère plus spécialisé Eg Google (recherche simple et avancée pour avoir les opérateurs de recherche. On peut déjà affiner les requêtes pour spécifier certaines éléments (filetype pour fichier pdf par exemple)

 

Le paramètre s’opère via des opérateurs (pour une expression exactes « utilisation des guillemets » pour faire une hypothèse de traduction par rapport au mots exa, cibler nos requêtes pour en préciser le résultat.

 

Opérateurs booléens

 

Une image contenant texte, affichage, Appareil de présentation, multimédia

Description générée automatiquement

 

Guillemet : «. » c’est bien mais après il faut regarder la source.

 

 

Casse : les majuscules et minuscules isn’t important

 

Joker : * pour remplacer un mot dans une expression. On peut intégrer formuler une hypothèse de traduction Une image contenant texte, intérieur, mur, tableau blanc

Description générée automatiquementCe n’est pas exhaustif

Google advanced search/ identifier des spécialistes et après =>

Google scholar : article scientifique, littérature de rang universitaire, article de recherches, revues (fiable)

 

Wikipedia, alimenter par les experts mais aussi les non-expert. Les articles sont rédigés indépendamment dans les langues donc sans traduction. Sources primaires ( très important et gage de serieux)

 

2.   Recherche lexicologique et terminologique sur internet

 

Lexicologie : la science du lexique

Terminologie : la science des termes (domaines spec,connaissance spec)

 


Moteurs de recherche

Recherche avancée Google

Google Scholar ( simple ou avancé)

Encyclopedia Britannica | Britannica

Encyclopædia Universalis

Wikipedia : oui mais valide le doc pls : croise les infos, retournes aux sources et évalue les.

Beluga, votre outil de recherche - Bibliothèques universitaires - Université Grenoble Alpes (univ-grenoble-alpes.fr) : collections numérique et fait tes recherches, met un accent sur bases essentielles

Documentation scientifique et technique, conseil et formation | Techniques de l’Ingénieur (grenet.fr) pour le français et hésite pas à te faire une base de données en creant un corpus


Pour le français : https://petitrobert-lerobert-com.sid2nomade-1.grenet.fr/

Science Direct.com ScienceDirect.com | Science, health and medical journals, full text articles and books.

PubMed PubMed (nih.gov) bio medical

Hal.science Accueil - Archive ouverte HAL : science ouverte


A market of black boxes: The political economy of Internet surveillance and censorship in Russia - Archive ouverte HAL civilisation russe


Dictionnaire


Oxford Learner’s dictionary : Oxford Advanced Learner's Dictionary at Oxford Learner's Dictionaries | Find meanings and definitions of words (oxfordlearnersdictionaries.com)


Longman Dictionary of Contemporary English | LDOCE (ldoceonline.com)

Cambridge Dictionary | English Dictionary, Translations & Thesaurus

Ressources du Français :

1.   TLFi (atilf.fr) :          pour résoudre un problème de vocabulaire, de consulter le dictionnaire en ligne Trésor de la Langue Française:

Peindre les objets suivants : pour mettre en lumière les catégories que tu peux filtrer

2.   EGF-Accueil (encyclogram.fr) une encyclopédie, porte sur la grammaire du français d’une manère assez large ( outils pedagogique et viens en complément du tlfi et academie fr

3.   Orthonet : http://orthonet.sdv.fr/ pour résoudre un problème d’orthographe, de consulter le site

4.   L'Académie Française: http://academie-francaise.fr/la-langue-francaise/questions-de-langue

5.   Dictionnaire de synonyme : CRISCO - Dictionnaire des synonymes (unicaen.fr) : traduire ou rédiger*

6.   Les Atlas sémantiques, dictionnaire de synonymes et traduction (atlas-semantiques.eu) proximité des mots en eux, fiches et cartes

7.   Centre National de Ressources Textuelles et Lexicales (cnrtl.fr) un outil

Terminologies | ORTOLANG

8.   Traduction gratuite en ligne | Lexicool annuaire de dico


Pour le français : https://petitrobert-lerobert-com.sid2nomade-1.grenet.fr/

LEXILOGOS - Dictionnaires, Cartes, Livres en ligne - Langues & pays du monde : français et russe

Unilingue d’abord et multilingue après

 

Banque de donnée terminologique

1.   IATE : créé pour les traducteurs de la commission européenne (en ligne depuis 2007)

Open expanded search

2.   TErmiumPlus : figure en terminologie (Montréal, pour le fr et eng)

2 elm SOURCE =>production de document fiable et facilitation de traduction POUR LES langueS de l’ALENA

3.   FranceTerme

4.   GDT Vitrine linguistique : La Vitrine linguistique de l’Office québécois de la langue française (gouv.qc.ca) GDT OU BDL (DEPANNAGE LINGUISTIQUE)

Outils d’aide à la rédaction

Outils d’aide à la rédaction – Ressources du Portail linguistique du Canada – Langues – Identité canadienne et société – Culture, histoire et sport – Canada.ca (noslangues-ourlanguages.gc.ca)

Dictionnaire de coocurences : permet d’accéder à des ensembles de mot avec un certain affinité

Juridictionnaire

Guide du rédacteur

WIPO PEARL / WIPO Pearl – WIPO’s Multilingual Terminology Portal

¾ validé et 4/4 validé par l’expert

FranceTerme : En lien avec dispositif enrichissement langue française

Loic depecker

Société française de terminologie : asso savante créé pour diffuser des infos sur la terminologie : certains nombres d’informations dessus

·        Promouvoir+soutenir des actions en matière de terminologie et domaine associés

·        Une rubrique : viens de paraître :Commission d'enrichissement de la langue française qui s’appuie sur des experts / pour normaliser les termes de la terminologie issue de la La délégation générale à la langue française et aux langues de France (culture.gouv.fr) dépends ministère de la culture, ils ont des terminologue et eux travaillent avec la Commission d'enrichissement de la langue française

Ex : vocabulaire de l’environement Légifrance - Publications officielles - Journal officiel - JORF n° 0123 du 28/05/2023 (legifrance.gouv.fr) issue du journal officiel

désimperméabilisation des sols

Domaine : AMÉNAGEMENT ET URBANISME-ENVIRONNEMENT.

Définition : Suppression du matériau de recouvrement imperméable d’un sol ou remplacement de ce dernier par un autre matériau, perméable.

Note : La désimperméabilisassions des sols contribue d’une part à réduire le ruissellement des eaux, et donc le risque d’inondation, d’autre part à favoriser leur infiltration et ainsi le rechargement des nappes phréatiques. V

oir aussi : artificialisation des sols, imperméabilisation des sols.

Équivalent étranger : –

Recommandations fait sur des sigles : pour normaliser des termes

Les organismes ont leurs portails terminologiques

Pour les projets de traduction, n’hésitez pas à voir sur les thématiques avec le domaine et objet de votre texte

Ex : PORTAIL TERMINOLOGIQUE DE LA FAO | Organisation des Nations Unies pour l'alimentation et l'agriculture


Terminologie et outils : liste des portails terminologique

En particulier :

Recueils de terminologie officielle sur Franceterme

De TermSciences à Loterre: des terminologies partagées - Inist : LOTERRE - Linked Open TERminology REsources - Accueil

PORTAILS TERMINOLOGIQUES on peut naviguer

terminologie et traduction

bases/banques de DONNEES TERMINOLOGIQUE


Term bank

Term bases

Terminologues

Traducteurs (ex : faire appel à une bases de donnéees multiterm alimenté par des trad)

Projet terminoik (IATE, wipopearl)

Approche trad individuelle/isolées

Ficher termino

Description des concepts structurant un domaine spécialisé (banque de donnée de lOMPI

Contenu appliqué à la résolution de prob en trad (équivalents et collocations)

Exhaustivité des données (champs de la fiche) gdt (les données ne sont pas exhau de façon systématique mais elle tend à avoir le meême type de contenu

Données fragmentaires qui vont permettre à répondre à un besoin

Termino thématique

Terminologie ponctuelle, ad hoc (quand on est dans un projet, on cherche à def les thématik)

Sources monolingues (contrôles stricts des sources) : ce sont les 1 er matériaux de travail, pas à partir d’une source traduite.

Corpus comparable

Monolingue et bilingues

(Concordancier en ligne et des bases de données en ligne, TA)



Corpus parallèles

Outil indépendant : ils ont leur propres autonomie

Outils intégré dans les environnement de travail en traduction (Translation Environment tools ( TenTs)

Approche onomasiologique (fondé sur un concept) est remodelé, refaçonné pour s’intéresser au terme et après le concept alors qu’à la base c’est l’inverse

Hybride (onomasiologique et sémasiologique)


L’introduction à la corpus : traduction specialisée et terminologie

TYPE DE CORPUS APPORT DE CORPUS

      I.           DEFINITION ET TYPE DE CORPUS

Un corpus : ensemble de texte sous format électronique exploitable de façon automatique ou semi-automatique, assemblée spécifiquement sur l’analyse linguistique selon des critères spécifiques.

Le corpus : not an vault/archive or a library

App basée sur corpus :

·        En lexicographie : tradition anglosaxon : dictionnaire pour apprenant conçu en s’appuyant sur corpus ( ex : Cobuilt : burmingame collection of text)

·        Dictionnaire frequentielle qui prend en compte la frequence ( de l’espagnol = l’importance de se basée sur l’usage pour pouvoir decider si on veut integrer un mot dans le dico.

·        Terminographie : concevoir des dicos, vocab, s’appuie sur les corpus à travers les outils comme les logiciels extractions automatiques terminologique, les textes sont extraits de ces corpus et les terminographe choisisse diff termes pour les intégrer dans leurs ressources

·        Mémoire de traduction : créer à partir de textes sources cibles, mais se combine des segmentations

Définir les différents types de corpus :

Monolingue : corpus 1 langues

Bilingue : 2 langues

Multilingue : 3 langues

A partir de là, on peut créer un corpus comparable

        A collectionn of texts composed independendly in the repective languages and put together on the basis of similarity of content domain and communicative function. Zanettin 1998

 et parallèles

Parallel corpora have components in two or more languages consisting of original texts and their translations. Aston 1999

Corpus de référence

Corpus représentatif d’une langue, pour faire une generalisation sur le fonctionnement d’une langue

Contient des données écrites orales différents types de texte

Ex :

British National Corpus

Corpus of contemporary American English

CREA

Dereko

Corpus spécialisé

Corpus contenant des données sur un aspect d’une partie des langues

Ex :

Variété de langue (anglais britanik, anglais americain)

Langue utilisée par un groupe de locuteurs (ex adolescents)

Type de texte (ex SMS)

Langues spécialisée liée à un dom de connaissances (ce qui nous intéresse)

Corpus utilisés pour décrire un domaine de spécialité

Methodo de constitut°

ü Manuel (recherche docu) voir 1 ere partie du cours

Critère de sélection :

Langue, taille, nombre de textes, intégralités ou portions, support, domaine de spécialité, type de texte, niveau de spec, date de publicat°

ü Automatique (outils en ligne ex : SketchEngine : Create and search a text corpus | Sketch Engine)

Utilisation d’un corpus pour la trad, WHY ?

Comprendre un texte en langue source (lecture dans la langue cibles)

Acquérir des connaissances sur les concepts clé d’un domaine (connaissance dont j’ai besoin pour restituer le sens)

Identifier des termes spécialisés

Utilisation de concordanciers (+/_ outils d’extraction automatique de terminologie

Identifier des équivalents de traduction (lingue, concept mais mis en langue différemment)

Identifier des termes proches sémantiquement

Pouvoir extraire des collocations

           Ex : there are some clouds, there are a few clouds, it’s a bid cloudy

Corpûs de prevision meteorologique partly cloudy (Pearson 2002)

Constituer des fiches terminoik

           Extraire des « contextes riches en connaissances » ( knowledge rich context KRC : (PDF) How the Notion of “Knowledge Rich Context” Can Be Characterized Today (researchgate.net))identifier le plus automatiquement possible pour apporter des connaissances au traducteurs.

           Extraire des infos de nature conceptuelle et linguistique

Corpus parallèle

Corpus traduit qui peut être comparable à linguee tardooit Reverso contexct mais d’avantage construits

De taille moyenne, spécialisé

Exemples :

EMEA : European Medicines Agency | (europa.eu)

Eur-lex

EuroParl

   II.           Outils d’exploitation des corpus

Corpus stocké sous format électronique

Pour être manipulable par ordinateur

Et pour être exploitable par des outils informatisés conçus pour l’analyse de corpus.


Affichage KWIC

Fréquence d’utilisation, nombre d’occurrence

Un corpus nous aide à distinguer le sens d’un mot

Concordanciers

Concordancier monolingue

           Corpus comparable

Concordancier bilingue

           Corpus parallèle/corpus de traductions

CORPUS ALIGN2 5 ALIGNEMENT PHRASTIQUE°

Concordancier en ligne

Concordancier A télécharger

Ex : AntConc (travailler avec mon propre corpus)

A télécharger : Télécharger AntConc pour Windows, Mac, iOS, Android, Linux - Telecharger.com (01net.com)

Concordancier en ligne (comment je contrôle mes corpus)

Recherche toutes les occurrences d’un mot (ou d’une expression) et les font apparaitre dans leurs contextes

Environnement linguistique du mot recherché (mot à droite mot à gauche)

Recherches dans un corpus défini (Web)

Verbe : produire des concordances (to concordance)

Ex : WebCorp: The Web as Corpus (.edu . org blabla)

Limites : corpus contraints (bases textuelles prédéfinis)

Contrôle des paramètres du corpus

 III.           Outils d’exploitation de corpus étiquetés/annotés


Corpus dans lequelle à chaque mot du corpus sont étiquetés (grammaticales)

Corpora are useful only if we can extracty knowlegde in information from them. The fact is that to extract information from a corpus, we often have to begin by building information in it

ü Etiquetage morphosynthaxique (POS tagging)

Attribuer un cat grammatical à chaque mot d’un corpus (utile pour chercher une suite de mots)

Nom, verbe, adjectif, etc

Utile pour chercher des suites de mots

Ex : downturn, upturn (verbs)

ü Lemmatisation (LemME, c’est la forme canonique)

Regrouper l’ensemble des formes d’un mot donné

           Singulier et pluriel pour les noms et adjectifs

           Différentes formes fléchies pour les verbes

Ex : processing, processed, processes, processs

Attribuer un lemme

           Forme canonique

Ex : processing | ed |es |process>process

ü Annotation syntaxique (outils : analyseur syntaxique, pour désambigüisé )

Identifier et attribuer les relations syntaxiques des mots entre eux

Ex : Sujet, verbe, COD


Retour

Actions

Actions