Logo
Unionpédia
Communication
Disponible sur Google Play
Nouveau! Téléchargez Unionpédia sur votre appareil Android™!
Gratuit
Accès plus rapide que le navigateur!
 

Partitionnement de données

Indice Partitionnement de données

clustering'' hiérarchique. Le partitionnement de données (ou en anglais) est une méthode en analyse des données.

76 relations: Administrateur de base de données, Algorithme à estimation de distribution, Algorithme espérance-maximisation, Analyse de similitudes, Analyse des logiciels malveillants, Analyse en composantes principales, Analyse sémantique latente, Ansatz, Apache Mahout, Apache Spark, Apprentissage automatique, Apprentissage automatique appliqué aux systèmes de détection d'intrusion réseau, Apprentissage non supervisé, Apprentissage supervisé, Arbre couvrant de poids minimal, Écart type, Barcoding de l'ADN microbien, Base de données, Centre informatique national de l'enseignement supérieur, Chimiométrie, Cluster, Clustering, Code smell, Complexité paramétrée, David Shmoys, Détection d'anomalies, Détection de visage, DBSCAN, Distance de Damerau-Levenshtein, Exploration de données, Fouille d'images, Gaz neuronal, Grille d'orientation sexuelle de Klein, Hierarchical File System, Ictus amnésique, Indexation automatique de documents, Indice de Calinski-Harabasz, Indice de Davies-Bouldin, Indice de Dunn, Indice de Rand, Intelligence artificielle, International Mathematics and Statistics Library, K-centre, K-médiane, K-moyennes, Lemme de Johnson-Lindenstrauss, Liste des paquets GNU, Littératie, Localisation automatique de bugs, MapReduce, ..., Modèle des croyances transférables, OPTICS, Partition, Partitionnement de données diffus, Partitionnement spectral, Passage à l'échelle d'une application web, Paul E. Green, Phylotype, Pistacia lentiscus, Polymorphisme de longueur des fragments de restriction terminaux, Problème de l'emplacement d'installations, Propagation d'affinité, Puce à ADN, Quantification vectorielle, Recherche des plus proches voisins, Regroupement hiérarchique, Robert Ladd Thorndike, Saison 4 de Numbers, Sécurité des systèmes cyber-physiques, Silhouette, Silhouette (clustering), Similarité (informatique), Statistique multivariée, Taxonomie numérique, Théorie du prototype, Unité taxonomique opérationnelle. Développer l'indice (26 plus) »

Administrateur de base de données

L'administrateur de base de données (DBA: en anglais) est une personne responsable du bon fonctionnement de serveurs de bases de données, essentiellement relationnelles (OLTP) ou décisionnelles (OLAP), tant au niveau de la conception des bases, des tests de validation, de la coordination des intervenants, de l'exploitation, de la protection et du contrôle d'utilisation.

Nouveau!!: Partitionnement de données et Administrateur de base de données · Voir plus »

Algorithme à estimation de distribution

Les algorithmes à estimation de distribution (Estimation of Distribution Algorithms, EDA, en anglais) forment une famille de métaheuristiques inspirée des algorithmes génétiques.

Nouveau!!: Partitionnement de données et Algorithme à estimation de distribution · Voir plus »

Algorithme espérance-maximisation

L'algorithme espérance-maximisation (en anglais expectation-maximization algorithm, souvent abrégé EM) est un algorithme itératif qui permet de trouver les paramètres du maximum de vraisemblance d'un modèle probabiliste lorsque ce dernier dépend de variables latentes non observables.

Nouveau!!: Partitionnement de données et Algorithme espérance-maximisation · Voir plus »

Analyse de similitudes

topic modeling afin de détecter (par analyse de similitudes) les thèmes de recherches dans un large corpus. L'analyse de similitudes est une méthode d'analyse des données s'inscrivant dans une approche issue de la théorie des graphes et qui se base sur la recherche de similitudes ou de dissimilitudes.

Nouveau!!: Partitionnement de données et Analyse de similitudes · Voir plus »

Analyse des logiciels malveillants

L'analyse des logiciels malveillants (« malware » en anglais) permet de déterminer leurs fonctionnements et leurs impacts potentiels.

Nouveau!!: Partitionnement de données et Analyse des logiciels malveillants · Voir plus »

Analyse en composantes principales

L'analyse en composantes principales (ACP ou PCA en anglais pour principal component analysis), ou, selon le domaine d'application, transformation de Karhunen–Loève (KLT) ou transformation de Hotelling, est une méthode de la famille de l'analyse des données et plus généralement de la statistique multivariée, qui consiste à transformer des variables liées entre elles (dites « corrélées » en statistique) en nouvelles variables décorrélées les unes des autres.

Nouveau!!: Partitionnement de données et Analyse en composantes principales · Voir plus »

Analyse sémantique latente

L’analyse sémantique latente (LSA, de l'anglais: Latent semantic analysis) ou indexation sémantique latente (ou LSI, de l'anglais: Latent semantic indexation) est un procédé de traitement des langues naturelles, dans le cadre de la sémantique vectorielle.

Nouveau!!: Partitionnement de données et Analyse sémantique latente · Voir plus »

Ansatz

Ansatz (de l'allemand, signifiant « début », « naissance », « racine »; au pluriel Ansätze) est un terme parfois utilisé par les physiciens et les mathématiciens pour décrire l'établissement d'une équation (ou de plusieurs équations) décrivant un problème mathématique ou physique.

Nouveau!!: Partitionnement de données et Ansatz · Voir plus »

Apache Mahout

Apache Mahout est un projet de la fondation Apache visant à créer des implémentations d'algorithmes d'apprentissage automatique distribués.

Nouveau!!: Partitionnement de données et Apache Mahout · Voir plus »

Apache Spark

Spark (ou Apache Spark) est un framework open source de calcul distribué.

Nouveau!!: Partitionnement de données et Apache Spark · Voir plus »

Apprentissage automatique

L'apprentissage automatique.

Nouveau!!: Partitionnement de données et Apprentissage automatique · Voir plus »

Apprentissage automatique appliqué aux systèmes de détection d'intrusion réseau

Les systèmes de détection d'intrusion reposent sur un ensemble de mécanismes et d'algorithmes permettant de détecter, de manière optimale, des intrusions ou menaces dans un réseau informatique.

Nouveau!!: Partitionnement de données et Apprentissage automatique appliqué aux systèmes de détection d'intrusion réseau · Voir plus »

Apprentissage non supervisé

Dans le domaine informatique et de l'intelligence artificielle, l'apprentissage non supervisé désigne la situation d'apprentissage automatique où les données ne sont pas étiquetées (par exemple étiquetées comme « balle » ou « poisson »).

Nouveau!!: Partitionnement de données et Apprentissage non supervisé · Voir plus »

Apprentissage supervisé

L'apprentissage supervisé (supervised learning en anglais) est une tâche d'apprentissage automatique consistant à apprendre une fonction de prédiction à partir d'exemples annotés, au contraire de l'apprentissage non supervisé.

Nouveau!!: Partitionnement de données et Apprentissage supervisé · Voir plus »

Arbre couvrant de poids minimal

L'arbre couvrant de poids minimal d'un graphe planaire. Chaque arête est identifiée avec son poids qui, ici, est approximativement sa longueur. En théorie des graphes, étant donné un graphe non orienté connexe dont les arêtes sont pondérées, un arbre couvrant de poids minimal (ACM), arbre couvrant minimum ou arbre sous-tendant minimum de ce graphe est un arbre couvrant (sous-ensemble qui est un arbre et qui connecte tous les sommets ensemble) dont la somme des poids des arêtes est minimale (c'est-à-dire de poids inférieur ou égal à celui de tous les autres arbres couvrants du graphe).

Nouveau!!: Partitionnement de données et Arbre couvrant de poids minimal · Voir plus »

Écart type

Exemple de deux échantillons ayant la même moyenne (100) mais des écarts types différents illustrant l'écart type comme mesure de la dispersion autour de la moyenne. La population rouge a un écart type (SD.

Nouveau!!: Partitionnement de données et Écart type · Voir plus »

Barcoding de l'ADN microbien

redresse.

Nouveau!!: Partitionnement de données et Barcoding de l'ADN microbien · Voir plus »

Base de données

Une base de données permet de stocker et de retrouver des données structurées, semi-structurées ou des données brutes ou de l'information, souvent en rapport avec un thème ou une activité; celles-ci peuvent être de natures différentes et plus ou moins reliées entre elles.

Nouveau!!: Partitionnement de données et Base de données · Voir plus »

Centre informatique national de l'enseignement supérieur

Le Centre informatique national de l'enseignement supérieur (CINES), basé à Montpellier, est un établissement public à caractère administratif français placé sous la tutelle du ministère de l'Enseignement supérieur, et créé par décret en 1999.

Nouveau!!: Partitionnement de données et Centre informatique national de l'enseignement supérieur · Voir plus »

Chimiométrie

La chimiométrie est l'application d'outils mathématiques, en particulier statistiques, pour obtenir le maximum d'informations à partir de données chimiques.

Nouveau!!: Partitionnement de données et Chimiométrie · Voir plus »

Cluster

Pas de description.

Nouveau!!: Partitionnement de données et Cluster · Voir plus »

Clustering

*: terme anglais désignant le partitionnement de données.

Nouveau!!: Partitionnement de données et Clustering · Voir plus »

Code smell

En génie logiciel, les code smells ou mauvaises odeurs peuvent être de mauvaises pratiques de conception logicielle qui conduisent à l’apparition de défauts.

Nouveau!!: Partitionnement de données et Code smell · Voir plus »

Complexité paramétrée

En algorithmique, la complexité paramétrée (ou complexité paramétrique) est une branche de la théorie de la complexité qui classifie les problèmes algorithmiques selon leur difficulté intrinsèque en fonction de plusieurs paramètres sur les données en entrée ou sur la sortie.

Nouveau!!: Partitionnement de données et Complexité paramétrée · Voir plus »

David Shmoys

David Bernard Shmoys est un mathématicien américain, né en 1959, spécialisé en optimisation (mathématiques) et recherche opérationnelle.

Nouveau!!: Partitionnement de données et David Shmoys · Voir plus »

Détection d'anomalies

Dans l'exploration de données, la détection d'anomalies (en anglais, anomaly detection ou outlier detection) est l'identification d'éléments, d'événements ou d'observations rares qui soulèvent des suspicions en différant de manière significative de la majorité des autres données.

Nouveau!!: Partitionnement de données et Détection d'anomalies · Voir plus »

Détection de visage

Détection de visage par la méthode de Viola et Jones. La détection de visage est un domaine de la vision par ordinateur consistant à détecter un visage humain dans une image numérique.

Nouveau!!: Partitionnement de données et Détection de visage · Voir plus »

DBSCAN

DBSCAN (density-based spatial clustering of applications with noise) est un algorithme de partitionnement de données proposé en 1996 par Martin Ester, Hans-Peter Kriegel, Jörg Sander et Xiaowei XuM.

Nouveau!!: Partitionnement de données et DBSCAN · Voir plus »

Distance de Damerau-Levenshtein

En informatique théorique, la distance de Damerau–Levenshtein est une distance entre deux chaînes de caractères.

Nouveau!!: Partitionnement de données et Distance de Damerau-Levenshtein · Voir plus »

Exploration de données

L’exploration de donnéesTerme recommandé au Canada par l'OQLF, et en France par la DGLFLF (Journal officiel du 27 février 2003) et par FranceTerme, connue aussi sous l'expression de fouille de données, forage de données, prospection de données,, ou encore extraction de connaissances à partir de données, a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques.

Nouveau!!: Partitionnement de données et Exploration de données · Voir plus »

Fouille d'images

La fouille d'images est le domaine de l'analyse et de l'extraction de connaissances appliquée aux images sous leurs diverses formes.

Nouveau!!: Partitionnement de données et Fouille d'images · Voir plus »

Gaz neuronal

Le gaz neuronal est un réseau de neurones artificiel, inspiré des cartes autoadaptatives, et introduites en 1991 par Thomas Martinetz et Klaus Schulten.

Nouveau!!: Partitionnement de données et Gaz neuronal · Voir plus »

Grille d'orientation sexuelle de Klein

La grille d'orientation sexuelle de Klein (Klein Sexual Orientation Grid, KSOG en anglais) a été développée par le Fritz Klein, sexologue spécialisé dans l'étude de la bisexualité.

Nouveau!!: Partitionnement de données et Grille d'orientation sexuelle de Klein · Voir plus »

Hierarchical File System

Le Hierarchical File System (HFS), est un système de fichiers propriétaire développé par Apple pour le système d'exploitation Mac OS.

Nouveau!!: Partitionnement de données et Hierarchical File System · Voir plus »

Ictus amnésique

L'ictus amnésique (abrégé IA) ou amnésie globale transitoire est un syndrome neurologique qui se caractérise essentiellement par un oubli à mesure (amnésie antérograde) d'installation soudaine.

Nouveau!!: Partitionnement de données et Ictus amnésique · Voir plus »

Indexation automatique de documents

L’indexation automatique de documents est un domaine de l'informatique et des sciences de l'information et des bibliothèques qui utilise des méthodes logicielles pour organiser un ensemble de documents et faciliter ultérieurement la recherche de contenu dans cette collection.

Nouveau!!: Partitionnement de données et Indexation automatique de documents · Voir plus »

Indice de Calinski-Harabasz

L'indice de Calinski-Harabasz est une mesure de qualité d'une partition d'un ensemble de données en classification automatique C'est le rapport entre la variance inter-groupes et la variance intra-groupe.

Nouveau!!: Partitionnement de données et Indice de Calinski-Harabasz · Voir plus »

Indice de Davies-Bouldin

En apprentissage automatique, plus précisément en classification automatique, l'indice de Davies-Bouldin est une mesure de qualité d'une partition d'un ensemble de données, introduite par David L. Davies et Donald W. Bouldin en 1979.

Nouveau!!: Partitionnement de données et Indice de Davies-Bouldin · Voir plus »

Indice de Dunn

L'indice de Dunn est une mesure de qualité d'une partition d'un ensemble de données en classification automatiqueA fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters, Dunn, Joseph C., Journal of Cybernetics, 1973.

Nouveau!!: Partitionnement de données et Indice de Dunn · Voir plus »

Indice de Rand

L'indice de Rand est une mesure de similarité entre deux partitions d'un ensemble.

Nouveau!!: Partitionnement de données et Indice de Rand · Voir plus »

Intelligence artificielle

assistants personnels intelligents sont l'une des applications concrètes de l'intelligence artificielle dans les années 2010. L'intelligence artificielle (IA) est un ensemble de théories et de techniques visant à réaliser des machines capables de simuler l'intelligence humaine.

Nouveau!!: Partitionnement de données et Intelligence artificielle · Voir plus »

International Mathematics and Statistics Library

IMSL, abrégé de International Mathematics and Statistics Library, est une bibliothèque logicielle d'objets utilisables pour le développement informatique d'applications d'analyse numérique.

Nouveau!!: Partitionnement de données et International Mathematics and Statistics Library · Voir plus »

K-centre

Le problème k-centre (k-center problem en anglaisLa traduction en français provient de la traduction par Nicolas Shabanel de, voir.) est un problème d'optimisation combinatoire, une branche de l'algorithmique.

Nouveau!!: Partitionnement de données et K-centre · Voir plus »

K-médiane

Le problème k-médiane, ou k-median en anglaisLa traduction en français provient de la traduction par Nicolas Shabanel de, voir.

Nouveau!!: Partitionnement de données et K-médiane · Voir plus »

K-moyennes

Le partitionnement en k-moyennes (ou en anglais) est une méthode de partitionnement de données et un problème d'optimisation combinatoire.

Nouveau!!: Partitionnement de données et K-moyennes · Voir plus »

Lemme de Johnson-Lindenstrauss

Le lemme de Johnson-Lindenstrauss est un théorème de géométrie.

Nouveau!!: Partitionnement de données et Lemme de Johnson-Lindenstrauss · Voir plus »

Liste des paquets GNU

Logo du système GNU. On appelle paquet GNU un paquet logiciel maintenu par le projet GNU et soutenu par la Free Software Foundation.

Nouveau!!: Partitionnement de données et Liste des paquets GNU · Voir plus »

Littératie

La littératie, ou lettrure, est définie par l'OCDE comme.

Nouveau!!: Partitionnement de données et Littératie · Voir plus »

Localisation automatique de bugs

La localisation automatisée de bug dans les logiciels informatiques est une activité du génie logiciel consistant à détecter des défauts pouvant provoquer des dysfonctionnements dans un programme.

Nouveau!!: Partitionnement de données et Localisation automatique de bugs · Voir plus »

MapReduce

MapReduce est un patron de conception de développement informatique, inventé par Google, dans lequel sont effectués des calculs parallèles, et souvent distribués, de données potentiellement très volumineuses, typiquement supérieures en taille à un téraoctet.

Nouveau!!: Partitionnement de données et MapReduce · Voir plus »

Modèle des croyances transférables

Le modèle des croyances transférables (MCT) est un modèle non probabiliste de « raisonnement incertain » reposant sur la théorie des fonctions de croyance.

Nouveau!!: Partitionnement de données et Modèle des croyances transférables · Voir plus »

OPTICS

OPTICS (acronyme de ordering points to identify the clustering structure en anglais) est un algorithme de partitionnement de données.

Nouveau!!: Partitionnement de données et OPTICS · Voir plus »

Partition

Le mot « partition », dérivé du latin partitio, a perdu son sens initial de division au profit du mot « partage » en français.

Nouveau!!: Partitionnement de données et Partition · Voir plus »

Partitionnement de données diffus

Le partitionnement diffus ou souple (en anglais, fuzzy clustering) est une forme de partitionnement de données dans laquelle chaque observation peut appartenir à plusieurs groupes (ou clusters).

Nouveau!!: Partitionnement de données et Partitionnement de données diffus · Voir plus »

Partitionnement spectral

En informatique théorique, le partitionnement spectral ou spectral clustering en anglais, est un type de partitionnement de données prenant en compte les propriétés spectrales de l'entrée.

Nouveau!!: Partitionnement de données et Partitionnement spectral · Voir plus »

Passage à l'échelle d'une application web

Le passage à l'échelle, anglicisme pour le redimensionnement et la mise à l'échelle, est la faculté qu’a un système à pouvoir changer de taille ou de volume selon les besoins des utilisateurs.

Nouveau!!: Partitionnement de données et Passage à l'échelle d'une application web · Voir plus »

Paul E. Green

Paul E. Green, né le et mort le, est un professeur de marketing et un statisticien américain.

Nouveau!!: Partitionnement de données et Paul E. Green · Voir plus »

Phylotype

En biologie, un phylotype est une définition opérationnelle utilisée pour regrouper des individus phylogénétiquement proches, quel que soit le rang taxonomique concerné (classe, genre, espèce...). Le regroupement est généralement basé sur la similarité de la séquence d'ADN d'un gène donné, qui sert de marqueur taxonomique (par exemple, l'ADNr 16S pour les bactéries et les archaea).

Nouveau!!: Partitionnement de données et Phylotype · Voir plus »

Pistacia lentiscus

Fleurs L’Arbre au mastic, ou Pistachier lentisque (Pistacia lentiscus L.) est un arbuste poussant dans les garrigues et les maquis des climats méditerranéens.

Nouveau!!: Partitionnement de données et Pistacia lentiscus · Voir plus »

Polymorphisme de longueur des fragments de restriction terminaux

Le polymorphisme de longueur des fragments de restriction terminaux (TRFLP, tRFLP ou parfois T-RFLP, pour l'anglais terminal restriction fragment length polymorphism) est une technique de biologie moléculaire permettant de dresser le profil des communautés microbiennes dans un échantillon ou un milieu en se basant sur la position d'un site de restriction la plus proche d'une extrémité marquée d'un gène amplifié.

Nouveau!!: Partitionnement de données et Polymorphisme de longueur des fragments de restriction terminaux · Voir plus »

Problème de l'emplacement d'installations

Le problème d'emplacement d'installations (facilities location problem) est un problème de recherche opérationnelle et de géométrie algorithmique.

Nouveau!!: Partitionnement de données et Problème de l'emplacement d'installations · Voir plus »

Propagation d'affinité

En programmation informatique, la propagation d'affinité est un algorithme récent de partitionnement de données, ou clustering, qui permet de trouver les éléments d'un ensemble qui sont les plus représentatifs - un critère de ressemblance étant donné - de l'ensemble.

Nouveau!!: Partitionnement de données et Propagation d'affinité · Voir plus »

Puce à ADN

Principe d'utilisation de la puce à ADN. Une puce à ADN est un ensemble de molécules d'ADN fixées en rangées ordonnées sur une petite surface qui peut être du verre, du silicium ou du plastique.

Nouveau!!: Partitionnement de données et Puce à ADN · Voir plus »

Quantification vectorielle

La quantification vectorielle est une technique de quantification souvent utilisée dans la compression de données avec pertes de données (Lossy Data Compression) pour laquelle l'idée de base est de coder ou de remplacer par une clé des valeurs d'un espace vectoriel multidimensionnel vers des valeurs d'un sous-espace discret de plus petite dimension.

Nouveau!!: Partitionnement de données et Quantification vectorielle · Voir plus »

Recherche des plus proches voisins

La recherche des plus proches voisins, ou des k plus proches voisins, est un problème algorithmique classique.

Nouveau!!: Partitionnement de données et Recherche des plus proches voisins · Voir plus »

Regroupement hiérarchique

Dans le domaine de l'analyse et de la classification automatique de données, le regroupement hiérarchique est un partitionnement de données ou clustering, au moyen de diverses méthodes, dites « ascendantes » et « descendantes ».

Nouveau!!: Partitionnement de données et Regroupement hiérarchique · Voir plus »

Robert Ladd Thorndike

Robert Ladd Thorndike, né à Montrose (New York) le et mort le à Olympia (Washington), est un psychologue américain, spécialiste de psychométrie et de psychologie de l'éducation.

Nouveau!!: Partitionnement de données et Robert Ladd Thorndike · Voir plus »

Saison 4 de Numbers

Cet article présente le guide des épisodes de la quatrième saison de la série télévisée américaine Numb3rs.

Nouveau!!: Partitionnement de données et Saison 4 de Numbers · Voir plus »

Sécurité des systèmes cyber-physiques

Les '''systèmes cyber-physiques''', historiquement utilisés dans les systèmes de contrôles industriels, se sont répandus dans des produits grand public au sein de l'internet des objets.

Nouveau!!: Partitionnement de données et Sécurité des systèmes cyber-physiques · Voir plus »

Silhouette

Silhouette admet plusieurs acceptions, dont certaines sont décrites ci-dessous.

Nouveau!!: Partitionnement de données et Silhouette · Voir plus »

Silhouette (clustering)

En partitionnement de données (clustering), le coefficient de silhouette est une mesure de qualité d'une partition d'un ensemble de données en classification automatique.

Nouveau!!: Partitionnement de données et Silhouette (clustering) · Voir plus »

Similarité (informatique)

En mathématique et en informatique la similarité est un critère important pour l'identification de sous-groupes dans un groupe d'objets, de valeurs (numériques ou non), de données (connues ou reconnues) dans un « espace » ou système...

Nouveau!!: Partitionnement de données et Similarité (informatique) · Voir plus »

Statistique multivariée

En statistique, les analyses multivariées ont pour caractéristique de s'intéresser à des lois de probabilité à plusieurs variables.

Nouveau!!: Partitionnement de données et Statistique multivariée · Voir plus »

Taxonomie numérique

En systématique, la taxonomie numérique, ou taxinomie numérique, est un système de classification des espèces utilisant des méthodes numériques appliquées aux caractères phénotypiques pour constituer les taxons.

Nouveau!!: Partitionnement de données et Taxonomie numérique · Voir plus »

Théorie du prototype

En sciences cognitives, la théorie du prototype est un modèle de catégorisation graduelle, dans lequel certains membres de la catégorie sont considérés comme plus représentatifs que d’autres; par exemple, lorsqu’on demande de fournir un exemple du concept de « meuble », le terme « chaise » est plus fréquemment cité que, disons, « tabouret ».

Nouveau!!: Partitionnement de données et Théorie du prototype · Voir plus »

Unité taxonomique opérationnelle

En biologie, une Unité Taxonomique Opérationnelle (abrégée en OTU, d'après l'anglais Operational Taxonomic Unit), est une définition opérationnelle utilisée pour regrouper des individus phylogénétiquement proches.

Nouveau!!: Partitionnement de données et Unité taxonomique opérationnelle · Voir plus »

Redirections ici:

Clusterisation, Partitionnement de donnees.

SortantEntrants
Hey! Nous sommes sur Facebook maintenant! »