I. Ressources numériques pour la recherche d’information : terminologie et documentation spécialisée
1. Traducteur et internet
Les recherches menées sur internet pour se familiariser avec un sujet spécialisé (acquérir de connaissance sur ce sujet et appropriation de terminologie et phraséologie il y a une étape à travers base de données, dictionnaires, consulter des ressources et des outils basés sur le corpus.
En parallèle des ressources du client (références, glossaires, mémoire de traduction)
Du général …. Vers un caractère plus spécialisé Eg Google (recherche simple et avancée pour avoir les opérateurs de recherche. On peut déjà affiner les requêtes pour spécifier certaines éléments (filetype pour fichier pdf par exemple)
Le paramètre s’opère via des opérateurs (pour une expression exactes « utilisation des guillemets » pour faire une hypothèse de traduction par rapport au mots exa, cibler nos requêtes pour en préciser le résultat.
Opérateurs booléens
Guillemet : «. » c’est bien mais après il faut regarder la source.
Casse : les majuscules et minuscules isn’t important
Joker : * pour remplacer un mot dans une expression. On peut intégrer formuler une hypothèse de traduction Ce n’est pas exhaustif
Google advanced search/ identifier des spécialistes et après =>
Google scholar : article scientifique, littérature de rang universitaire, article de recherches, revues (fiable)
Wikipedia, alimenter par les experts mais aussi les non-expert. Les articles sont rédigés indépendamment dans les langues donc sans traduction. Sources primaires ( très important et gage de serieux)
2. Recherche lexicologique et terminologique sur internet
Lexicologie : la science du lexique
Terminologie : la science des termes (domaines spec,connaissance spec)
Moteurs de recherche
Google Scholar ( simple ou avancé)
Encyclopedia Britannica | Britannica
Wikipedia : oui mais valide le doc pls : croise les infos, retournes aux sources et évalue les.
Beluga, votre outil de recherche - Bibliothèques universitaires - Université Grenoble Alpes (univ-grenoble-alpes.fr) : collections numérique et fait tes recherches, met un accent sur bases essentielles
Documentation scientifique et technique, conseil et formation | Techniques de l’Ingénieur (grenet.fr) pour le français et hésite pas à te faire une base de données en creant un corpus
Pour le français : https://petitrobert-lerobert-com.sid2nomade-1.grenet.fr/
Science Direct.com ScienceDirect.com | Science, health and medical journals, full text articles and books.
PubMed PubMed (nih.gov) bio medical
Hal.science Accueil - Archive ouverte HAL : science ouverte
A market of black boxes: The political economy of Internet surveillance and censorship in Russia - Archive ouverte HAL civilisation russe
Dictionnaire
Oxford Learner’s dictionary : Oxford Advanced Learner's Dictionary at Oxford Learner's Dictionaries | Find meanings and definitions of words (oxfordlearnersdictionaries.com)
Longman Dictionary of Contemporary English | LDOCE (ldoceonline.com)
Cambridge Dictionary | English Dictionary, Translations & Thesaurus
Ressources du Français :
1. TLFi (atilf.fr) : pour résoudre un problème de vocabulaire, de consulter le dictionnaire en ligne Trésor de la Langue Française:
Peindre les objets suivants : pour mettre en lumière les catégories que tu peux filtrer
2. EGF-Accueil (encyclogram.fr) une encyclopédie, porte sur la grammaire du français d’une manère assez large ( outils pedagogique et viens en complément du tlfi et academie fr
3. Orthonet : http://orthonet.sdv.fr/ pour résoudre un problème d’orthographe, de consulter le site
4. L'Académie Française: http://academie-francaise.fr/la-langue-francaise/questions-de-langue
5. Dictionnaire de synonyme : CRISCO - Dictionnaire des synonymes (unicaen.fr) : traduire ou rédiger*
6. Les Atlas sémantiques, dictionnaire de synonymes et traduction (atlas-semantiques.eu) proximité des mots en eux, fiches et cartes
7. Centre National de Ressources Textuelles et Lexicales (cnrtl.fr) un outil
8. Traduction gratuite en ligne | Lexicool annuaire de dico
Pour le français : https://petitrobert-lerobert-com.sid2nomade-1.grenet.fr/
LEXILOGOS - Dictionnaires, Cartes, Livres en ligne - Langues & pays du monde : français et russe
Unilingue d’abord et multilingue après
Banque de donnée terminologique
1. IATE : créé pour les traducteurs de la commission européenne (en ligne depuis 2007)
Open expanded search
2. TErmiumPlus : figure en terminologie (Montréal, pour le fr et eng)
2 elm SOURCE =>production de document fiable et facilitation de traduction POUR LES langueS de l’ALENA
3. FranceTerme
4. GDT Vitrine linguistique : La Vitrine linguistique de l’Office québécois de la langue française (gouv.qc.ca) GDT OU BDL (DEPANNAGE LINGUISTIQUE)
Outils d’aide à la rédaction
Dictionnaire de coocurences : permet d’accéder à des ensembles de mot avec un certain affinité
Juridictionnaire
Guide du rédacteur
WIPO PEARL / WIPO Pearl – WIPO’s Multilingual Terminology Portal
¾ validé et 4/4 validé par l’expert
FranceTerme : En lien avec dispositif enrichissement langue française
Loic depecker
Société française de terminologie : asso savante créé pour diffuser des infos sur la terminologie : certains nombres d’informations dessus
· Promouvoir+soutenir des actions en matière de terminologie et domaine associés
· Une rubrique : viens de paraître :Commission d'enrichissement de la langue française qui s’appuie sur des experts / pour normaliser les termes de la terminologie issue de la La délégation générale à la langue française et aux langues de France (culture.gouv.fr) dépends ministère de la culture, ils ont des terminologue et eux travaillent avec la Commission d'enrichissement de la langue française
Ex : vocabulaire de l’environement Légifrance - Publications officielles - Journal officiel - JORF n° 0123 du 28/05/2023 (legifrance.gouv.fr) issue du journal officiel
désimperméabilisation des sols
Domaine : AMÉNAGEMENT ET URBANISME-ENVIRONNEMENT.
Définition : Suppression du matériau de recouvrement imperméable d’un sol ou remplacement de ce dernier par un autre matériau, perméable.
Note : La désimperméabilisassions des sols contribue d’une part à réduire le ruissellement des eaux, et donc le risque d’inondation, d’autre part à favoriser leur infiltration et ainsi le rechargement des nappes phréatiques. V
oir aussi : artificialisation des sols, imperméabilisation des sols.
Équivalent étranger : –
Recommandations fait sur des sigles : pour normaliser des termes
Les organismes ont leurs portails terminologiques
Pour les projets de traduction, n’hésitez pas à voir sur les thématiques avec le domaine et objet de votre texte
Terminologie et outils : liste des portails terminologique
En particulier :
Recueils de terminologie officielle sur Franceterme
De TermSciences à Loterre: des terminologies partagées - Inist : LOTERRE - Linked Open TERminology REsources - Accueil
PORTAILS TERMINOLOGIQUES on peut naviguer
terminologie et traduction
bases/banques de DONNEES TERMINOLOGIQUE
Term bank
Term bases
Terminologues
Traducteurs (ex : faire appel à une bases de donnéees multiterm alimenté par des trad)
Projet terminoik (IATE, wipopearl)
Approche trad individuelle/isolées
Ficher termino
Description des concepts structurant un domaine spécialisé (banque de donnée de lOMPI
Contenu appliqué à la résolution de prob en trad (équivalents et collocations)
Exhaustivité des données (champs de la fiche) gdt (les données ne sont pas exhau de façon systématique mais elle tend à avoir le meême type de contenu
Données fragmentaires qui vont permettre à répondre à un besoin
Termino thématique
Terminologie ponctuelle, ad hoc (quand on est dans un projet, on cherche à def les thématik)
Sources monolingues (contrôles stricts des sources) : ce sont les 1 er matériaux de travail, pas à partir d’une source traduite.
Corpus comparable
Monolingue et bilingues
(Concordancier en ligne et des bases de données en ligne, TA)
Corpus parallèles
Outil indépendant : ils ont leur propres autonomie
Outils intégré dans les environnement de travail en traduction (Translation Environment tools ( TenTs)
Approche onomasiologique (fondé sur un concept) est remodelé, refaçonné pour s’intéresser au terme et après le concept alors qu’à la base c’est l’inverse
Hybride (onomasiologique et sémasiologique)
L’introduction à la corpus : traduction specialisée et terminologie
TYPE DE CORPUS APPORT DE CORPUS
I. DEFINITION ET TYPE DE CORPUS
Un corpus : ensemble de texte sous format électronique exploitable de façon automatique ou semi-automatique, assemblée spécifiquement sur l’analyse linguistique selon des critères spécifiques.
Le corpus : not an vault/archive or a library
App basée sur corpus :
· En lexicographie : tradition anglosaxon : dictionnaire pour apprenant conçu en s’appuyant sur corpus ( ex : Cobuilt : burmingame collection of text)
· Dictionnaire frequentielle qui prend en compte la frequence ( de l’espagnol = l’importance de se basée sur l’usage pour pouvoir decider si on veut integrer un mot dans le dico.
· Terminographie : concevoir des dicos, vocab, s’appuie sur les corpus à travers les outils comme les logiciels extractions automatiques terminologique, les textes sont extraits de ces corpus et les terminographe choisisse diff termes pour les intégrer dans leurs ressources
· Mémoire de traduction : créer à partir de textes sources cibles, mais se combine des segmentations
Définir les différents types de corpus :
Monolingue : corpus 1 langues
Bilingue : 2 langues
Multilingue : 3 langues
A partir de là, on peut créer un corpus comparable
A collectionn of texts composed independendly in the repective languages and put together on the basis of similarity of content domain and communicative function. Zanettin 1998
et parallèles
Parallel corpora have components in two or more languages consisting of original texts and their translations. Aston 1999
Corpus de référence
Corpus représentatif d’une langue, pour faire une generalisation sur le fonctionnement d’une langue
Contient des données écrites orales différents types de texte
Ex :
British National Corpus
Corpus of contemporary American English
CREA
Dereko
Corpus spécialisé
Corpus contenant des données sur un aspect d’une partie des langues
Ex :
Variété de langue (anglais britanik, anglais americain)
Langue utilisée par un groupe de locuteurs (ex adolescents)
Type de texte (ex SMS)
Langues spécialisée liée à un dom de connaissances (ce qui nous intéresse)
Corpus utilisés pour décrire un domaine de spécialité
Methodo de constitut°
ü Manuel (recherche docu) voir 1 ere partie du cours
Critère de sélection :
Langue, taille, nombre de textes, intégralités ou portions, support, domaine de spécialité, type de texte, niveau de spec, date de publicat°
ü Automatique (outils en ligne ex : SketchEngine : Create and search a text corpus | Sketch Engine)
Utilisation d’un corpus pour la trad, WHY ?
Comprendre un texte en langue source (lecture dans la langue cibles)
Acquérir des connaissances sur les concepts clé d’un domaine (connaissance dont j’ai besoin pour restituer le sens)
Identifier des termes spécialisés
Utilisation de concordanciers (+/_ outils d’extraction automatique de terminologie
Identifier des équivalents de traduction (lingue, concept mais mis en langue différemment)
Identifier des termes proches sémantiquement
Pouvoir extraire des collocations
Ex : there are some clouds, there are a few clouds, it’s a bid cloudy
Corpûs de prevision meteorologique partly cloudy (Pearson 2002)
Constituer des fiches terminoik
Extraire des « contextes riches en connaissances » ( knowledge rich context KRC : (PDF) How the Notion of “Knowledge Rich Context” Can Be Characterized Today (researchgate.net))identifier le plus automatiquement possible pour apporter des connaissances au traducteurs.
Extraire des infos de nature conceptuelle et linguistique
Corpus parallèle
Corpus traduit qui peut être comparable à linguee tardooit Reverso contexct mais d’avantage construits
De taille moyenne, spécialisé
Exemples :
EMEA : European Medicines Agency | (europa.eu)
Eur-lex
EuroParl
II. Outils d’exploitation des corpus
Corpus stocké sous format électronique
Pour être manipulable par ordinateur
Et pour être exploitable par des outils informatisés conçus pour l’analyse de corpus.
Affichage KWIC
Fréquence d’utilisation, nombre d’occurrence
Un corpus nous aide à distinguer le sens d’un mot
Concordanciers
Concordancier monolingue
Corpus comparable
Concordancier bilingue
Corpus parallèle/corpus de traductions
CORPUS ALIGN2 5 ALIGNEMENT PHRASTIQUE°
Concordancier en ligne
Concordancier A télécharger
Ex : AntConc (travailler avec mon propre corpus)
A télécharger : Télécharger AntConc pour Windows, Mac, iOS, Android, Linux - Telecharger.com (01net.com)
Concordancier en ligne (comment je contrôle mes corpus)
Recherche toutes les occurrences d’un mot (ou d’une expression) et les font apparaitre dans leurs contextes
Environnement linguistique du mot recherché (mot à droite mot à gauche)
Recherches dans un corpus défini (Web)
Verbe : produire des concordances (to concordance)
Ex : WebCorp: The Web as Corpus (.edu . org blabla)
Limites : corpus contraints (bases textuelles prédéfinis)
Contrôle des paramètres du corpus
III. Outils d’exploitation de corpus étiquetés/annotés
Corpus dans lequelle à chaque mot du corpus sont étiquetés (grammaticales)
Corpora are useful only if we can extracty knowlegde in information from them. The fact is that to extract information from a corpus, we often have to begin by building information in it
ü Etiquetage morphosynthaxique (POS tagging)
Attribuer un cat grammatical à chaque mot d’un corpus (utile pour chercher une suite de mots)
Nom, verbe, adjectif, etc
Utile pour chercher des suites de mots
Ex : downturn, upturn (verbs)
ü Lemmatisation (LemME, c’est la forme canonique)
Regrouper l’ensemble des formes d’un mot donné
Singulier et pluriel pour les noms et adjectifs
Différentes formes fléchies pour les verbes
Ex : processing, processed, processes, processs
Attribuer un lemme
Forme canonique
Ex : processing | ed |es |process>process
ü Annotation syntaxique (outils : analyseur syntaxique, pour désambigüisé )
Identifier et attribuer les relations syntaxiques des mots entre eux
Ex : Sujet, verbe, COD