Logo
Unionpédia
Communication
Disponible sur Google Play
Nouveau! Téléchargez Unionpédia sur votre appareil Android™!
Télécharger
Accès plus rapide que le navigateur!
 

Fouille de textes

Indice Fouille de textes

La fouille de textes ou « l'extraction de connaissances » dans les textes est une spécialisation de la fouille de données et fait partie du domaine de l'intelligence artificielle.

50 relations: Algorithmique, Apache Software Foundation, Apprentissage automatique, École normale supérieure de Lyon, Compréhension du langage naturel, Correcteur (informatique), Défi fouille de texte, Echelon, Europol, Exalead, Exploration de données, Génération automatique de textes, Google, Humanités numériques, IBM, Index inversé, Indexation automatique de documents, Informatique, Intelligence artificielle, Intelligence économique, Lemmatisation, Linguistique, Linguistique informatique, Lutte anti-spam, MATLAB, Moteur de recherche, Nature (revue), Nature Genetics, Ontologie (informatique), Open Language Archives Community, OW2, PageRank, PubGene, Résumé automatique de texte, RDF Schema, Recherche d'information, Reconnaissance automatique de la parole, Resource Description Framework, Spam, Statistique, Text Encoding Initiative, Traduction automatique, Traitement automatique du langage naturel, Traitement de l'information, Université Paris-Est-Marne-la-Vallée, Université Simon Fraser, Web Ontology Language, Web sémantique, WordStat (logiciel), Yahoo!.

Algorithmique

Organigramme de programmation représentant l'algorithme d'Euclide. Lalgorithmique est l'étude et la production de règles et techniques qui sont impliquées dans la définition et la conception d'algorithmes, c'est-à-dire de processus systématiques de résolution d'un problème permettant de décrire précisément des étapes pour résoudre un problème algorithmique.

Nouveau!!: Fouille de textes et Algorithmique · Voir plus »

Apache Software Foundation

LApache Software Foundation (ASF) est une organisation à but non lucratif qui développe des logiciels open source sous la licence Apache, dont le renommé serveur web Apache HTTP Server.

Nouveau!!: Fouille de textes et Apache Software Foundation · Voir plus »

Apprentissage automatique

L'apprentissage automatique.

Nouveau!!: Fouille de textes et Apprentissage automatique · Voir plus »

École normale supérieure de Lyon

L'École normale supérieure de Lyon (ou ENS de Lyon) est une grande école scientifique et littéraire française, l'une des quatre écoles normales supérieures.

Nouveau!!: Fouille de textes et École normale supérieure de Lyon · Voir plus »

Compréhension du langage naturel

''L'apprentissage de la lecture'' par Sigurður málari, 19e siècle. La compréhension du langage naturel (NLU en anglais) ou linterprétation en langage naturel (NLI) est une sous-rubrique du traitement de la langue naturelle en intelligence artificielle qui traite de la compréhension en lecture automatique.

Nouveau!!: Fouille de textes et Compréhension du langage naturel · Voir plus »

Correcteur (informatique)

Un correcteur est, en informatique, un outil logiciel permettant d'analyser un texte afin de détecter, et éventuellement de corriger, les fautes d'orthographe et les coquilles qu'il contient.

Nouveau!!: Fouille de textes et Correcteur (informatique) · Voir plus »

Défi fouille de texte

DEFT ou Défi fouille de texte est une campagne d'évaluation scientifique francophone portant sur la fouille de textes.

Nouveau!!: Fouille de textes et Défi fouille de texte · Voir plus »

Echelon

Station d'interception ROEM du réseau ECHELON située à Menwith Hill, au Royaume-Uni.ECHELON est un nom de code utilisé pendant de nombreuses années par les services de renseignement des États-Unis pour désigner un réseau utilisé pour la surveillance et l'interception des télécommunications.

Nouveau!!: Fouille de textes et Echelon · Voir plus »

Europol

Europol (European Union Agency for Law Enforcement Cooperation, anciennement European Police Office) est une agence européenne de police criminelle qui facilite l'échange de renseignements entre polices nationales en matière de stupéfiants, de terrorisme, de criminalité internationale et de pédocriminalité au sein de l'Union européenne.

Nouveau!!: Fouille de textes et Europol · Voir plus »

Exalead

Exalead était une entreprise développant une solution logicielle créée en 2000 et spécialisée dans les infrastructures proposant des applications pour les entreprises sur une base de moteur de recherche.

Nouveau!!: Fouille de textes et Exalead · Voir plus »

Exploration de données

L’exploration de donnéesTerme recommandé au Canada par l'OQLF, et en France par la DGLFLF (Journal officiel du 27 février 2003) et par FranceTerme, connue aussi sous l'expression de fouille de données, forage de données, prospection de données,, ou encore extraction de connaissances à partir de données, a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques.

Nouveau!!: Fouille de textes et Exploration de données · Voir plus »

Génération automatique de textes

La génération automatique de texte (GAT) est une sous discipline de la linguistique computationnelle qui vise à exprimer sous une forme textuelle, syntaxiquement et sémantiquement correcteBateman & Zock (2003).

Nouveau!!: Fouille de textes et Génération automatique de textes · Voir plus »

Google

Google LLC Prononciation en anglais américain retranscrite selon la norme API.

Nouveau!!: Fouille de textes et Google · Voir plus »

Humanités numériques

analyse de réseau de métadonnées. Les humanités numériques (traduction française de digital humanities) ou sciences humaines numériques.

Nouveau!!: Fouille de textes et Humanités numériques · Voir plus »

IBM

International Business Machines Corporation, connue sous le sigle IBM, est une entreprise multinationale américaine présente dans les domaines du matériel informatique, du logiciel et des services informatiques.

Nouveau!!: Fouille de textes et IBM · Voir plus »

Index inversé

En informatique, un index inversé est une correspondance entre du contenu, comme des mots ou des nombres, et sa position dans un ensemble de données comme un enregistrement en base de données, un document ou un ensemble de documents; sur le même principe qu'un index terminologique.

Nouveau!!: Fouille de textes et Index inversé · Voir plus »

Indexation automatique de documents

L’indexation automatique de documents est un domaine de l'informatique et des sciences de l'information et des bibliothèques qui utilise des méthodes logicielles pour organiser un ensemble de documents et faciliter ultérieurement la recherche de contenu dans cette collection.

Nouveau!!: Fouille de textes et Indexation automatique de documents · Voir plus »

Informatique

bibliothèque d'Art et d'Archéologie de Genève (2017). L'informatique est un domaine d'activité scientifique, technique, et industriel concernant le traitement automatique de l'information numérique par l'exécution de programmes informatiques hébergés par des dispositifs électriques-électroniques: des systèmes embarqués, des ordinateurs, des robots, des automates Ces champs d'application peuvent être séparés en deux branches.

Nouveau!!: Fouille de textes et Informatique · Voir plus »

Intelligence artificielle

assistants personnels intelligents sont l'une des applications concrètes de l'intelligence artificielle dans les années 2010. L'intelligence artificielle (IA) est un ensemble de théories et de techniques visant à réaliser des machines capables de simuler l'intelligence humaine.

Nouveau!!: Fouille de textes et Intelligence artificielle · Voir plus »

Intelligence économique

Diagramme sur le système d'intelligence compétitive et technologique.L’intelligence économique est l'ensemble des activités coordonnées de collecte, de traitement et de diffusion de l'information utile aux acteurs économiques, en vue de son exploitation.

Nouveau!!: Fouille de textes et Intelligence économique · Voir plus »

Lemmatisation

La lemmatisation désigne un traitement lexical apporté à un texte en vue de son classement dans un index ou de son analyse.

Nouveau!!: Fouille de textes et Lemmatisation · Voir plus »

Linguistique

La linguistique est une discipline scientifique s’intéressant à l’étude du langage.

Nouveau!!: Fouille de textes et Linguistique · Voir plus »

Linguistique informatique

La linguistique informatique est un champ interdisciplinaire basé sur une modélisation symbolique (à base de règles) ou statistique du langage naturel établie dans une perspective informatique.

Nouveau!!: Fouille de textes et Linguistique informatique · Voir plus »

Lutte anti-spam

La lutte antipourriel (anti-spam ou anti-spamming, ou antipollupostage) est un ensemble de comportements, de systèmes et de moyens techniques et juridiques permettant de combattre le pourriel (ou « spam », courriers électroniques publicitaires non sollicités).

Nouveau!!: Fouille de textes et Lutte anti-spam · Voir plus »

MATLAB

MATLAB (ou Matlab) est un langage de script destiné au calcul numérique, et émulé par l'environnement de développement du même nom.

Nouveau!!: Fouille de textes et MATLAB · Voir plus »

Moteur de recherche

Capture d'écran d'une page de résultat de recherche Un moteur de recherche est une application permettant à un utilisateur d'effectuer une recherche locale ou en ligne, c'est-à-dire de trouver des ressources à partir d'une requête composée de termes.

Nouveau!!: Fouille de textes et Moteur de recherche · Voir plus »

Nature (revue)

Nature est une revue scientifique généraliste de référence, à comité de lecture et publiée de manière hebdomadaire.

Nouveau!!: Fouille de textes et Nature (revue) · Voir plus »

Nature Genetics

Nature Genetics (abrégé en Nat. Genet.) est une revue scientifique britannique à comité de lecture spécialisée dans tous les aspects de la recherche en génétique, de la génétique moléculaire fondamentale aux modèles physiopathologiques humains et à la thérapie génique.

Nouveau!!: Fouille de textes et Nature Genetics · Voir plus »

Ontologie (informatique)

En informatique et en science de l'information, une ontologie est un modèle de données contenant des concepts et relations permettant de modéliser un ensemble de connaissances dans un domaine donné.

Nouveau!!: Fouille de textes et Ontologie (informatique) · Voir plus »

Open Language Archives Community

en L'Open Language Archives Community (OLAC, en français: « communauté ouverte des archives linguistiques ») est un partenariat international d'institutions et d'individus fondé en 2000, visant à créer une bibliothèque virtuelle mondiale de ressources linguistiques.

Nouveau!!: Fouille de textes et Open Language Archives Community · Voir plus »

OW2

OW2 est une association (loi de 1901) indépendante à but non lucratif dédiée au développement d’une base de logiciels d’infrastructure en open source.

Nouveau!!: Fouille de textes et OW2 · Voir plus »

PageRank

Illustration du PageRank. Le PageRankAntonomase du nom de marque inventé par Larry Page, cofondateur de Google, composé des mots anglais page (« page ») et rank (« rang »).

Nouveau!!: Fouille de textes et PageRank · Voir plus »

PubGene

PubGene AS est une entreprise norvégienne, filiale de PubGene Inc.

Nouveau!!: Fouille de textes et PubGene · Voir plus »

Résumé automatique de texte

Un résumé est une forme de compression textuelle avec perte d'information.

Nouveau!!: Fouille de textes et Résumé automatique de texte · Voir plus »

RDF Schema

RDF Schema ou RDFS (acronyme de Resource Description Framework Schema) est un langage extensible de représentation des connaissances.

Nouveau!!: Fouille de textes et RDF Schema · Voir plus »

Recherche d'information

La recherche d'information (RI) est le domaine qui étudie la manière de retrouver des informations dans un corpus.

Nouveau!!: Fouille de textes et Recherche d'information · Voir plus »

Reconnaissance automatique de la parole

applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.

Nouveau!!: Fouille de textes et Reconnaissance automatique de la parole · Voir plus »

Resource Description Framework

(RDF) est un modèle de graphe destiné à décrire formellement les ressources Web et leurs métadonnées, afin de permettre le traitement automatique de telles descriptions.

Nouveau!!: Fouille de textes et Resource Description Framework · Voir plus »

Spam

Boîte de réception infestée. Le spam, courriel indésirable ou pourriel est une communication électronique non sollicitée, en premier lieu via le courrier électronique.

Nouveau!!: Fouille de textes et Spam · Voir plus »

Statistique

La statistique est la discipline qui étudie des phénomènes à travers la collecte de données, leur traitement, leur analyse, l'interprétation des résultats et leur présentation afin de rendre ces données compréhensibles par tous.

Nouveau!!: Fouille de textes et Statistique · Voir plus »

Text Encoding Initiative

La Text Encoding Initiative (abrégé en TEI, en français « initiative pour l’encodage du texte ») est un format de balisage et une communauté académique internationale dans le champ des humanités numériques visant à définir des recommandations pour l’encodage de ressources numériques, et plus particulièrement de documents textuels.

Nouveau!!: Fouille de textes et Text Encoding Initiative · Voir plus »

Traduction automatique

La traduction automatique désigne la traduction brute d'un texte entièrement réalisée par un ou plusieurs programmes informatiques.

Nouveau!!: Fouille de textes et Traduction automatique · Voir plus »

Traitement automatique du langage naturel

Le traitement automatique du langage naturel (TALN), en anglais natural language processing ou NLP, est un domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle, qui vise à créer des outils de traitement du langage naturel pour diverses applications.

Nouveau!!: Fouille de textes et Traitement automatique du langage naturel · Voir plus »

Traitement de l'information

Le traitement de l'information est le processus de changement de l'information de toute manière détectable par un observateur.

Nouveau!!: Fouille de textes et Traitement de l'information · Voir plus »

Université Paris-Est-Marne-la-Vallée

L’université de Marne-la-Vallée est une université française pluridisciplinaire située à Champs-sur-Marne sur le site du campus de Marne-la-Vallée à la Cité Descartes, qui a juridiquement existé entre 1991 et 2020.

Nouveau!!: Fouille de textes et Université Paris-Est-Marne-la-Vallée · Voir plus »

Université Simon Fraser

L’Université Simon Fraser (en anglais, Simon Fraser University – SFU) est une université publique située en Colombie-Britannique dont le campus principal est situé sur le, à Burnaby, à à l'est de Vancouver, et les campus secondaires au centre-ville de Vancouver et de Surrey.

Nouveau!!: Fouille de textes et Université Simon Fraser · Voir plus »

Web Ontology Language

(OWL) est un langage de représentation des connaissances construit sur le modèle de données de RDF.

Nouveau!!: Fouille de textes et Web Ontology Language · Voir plus »

Web sémantique

Logo du W3C pour le Web sémantique Le Web sémantique, ou toile sémantique.

Nouveau!!: Fouille de textes et Web sémantique · Voir plus »

WordStat (logiciel)

WordStat est un logiciel d'analyse de texte.

Nouveau!!: Fouille de textes et WordStat (logiciel) · Voir plus »

Yahoo!

Yahoo! est une société américaine de services web créée en 1994, appartenant, entre 2017 et 2021 à Verizon Media et, désormais, à Apollo Global Management.

Nouveau!!: Fouille de textes et Yahoo! · Voir plus »

Redirections ici:

Fouille de texte, Text mining, Textmining.

SortantEntrants
Hey! Nous sommes sur Facebook maintenant! »