DéveloppeurWeb.Com
    DéveloppeurWeb.Com
    • Agile Zone
    • AI Zone
    • Cloud Zone
    • Database Zone
    • DevOps Zone
    • Integration Zone
    • Web Dev Zone
    DéveloppeurWeb.Com
    Home»Uncategorized»Une analyse complète d’AutoML
    Uncategorized

    Une analyse complète d’AutoML

    février 15, 2023
    Une analyse complète d'AutoML
    Share
    Facebook Twitter Pinterest Reddit WhatsApp Email

    Table des matières

    • Introduction
    • Qu’est-ce qu’AutoML ?
    • Pourquoi AutoML est-il le besoin du futur ?
    • Diverses plates-formes AutoML
    • AutoML remplacera-t-il les data scientists ?
    • Conclusion
    • Les références

    Image parGerd Altmann de Pixabay

    Introduction

    Une vieille idée qui a tout changé est l’automatisation. Chaque outil et méthode que nous avons créé, d’une manière ou d’une autre, implique un certain niveau d’automatisation. Un domaine émergent connu sous le nom d’apprentissage automatique automatisé, ou AutoML, automatise le processus de création de modèles d’apprentissage automatique pour modéliser les données. Avec les meilleurs projets AutoML pour ML, les projets de machine learning sont désormais incroyablement simples à terminer. Les novices comme les experts peuvent bénéficier à tout moment de l’utilisation des bibliothèques AutoML pour les applications d’apprentissage automatique sans risque d’erreur. Ces bibliothèques sont bien connues pour offrir des ressources permettant d’identifier automatiquement les meilleures initiatives d’apprentissage automatique pour une tâche impliquant la modélisation prédictive. Explorons quelques-unes des dix meilleures bibliothèques AutoML pour les projets d’apprentissage automatique qui deviennent populaires parmi les chercheurs ces derniers temps.

    Qu’est-ce qu’AutoML ?

    Le terme « AutoML » fait référence à l’automatisation de tout ou partie des processus de construction de modèles d’apprentissage automatique, y compris la sélection et la configuration des fonctionnalités, le réglage des mesures de performances, la sélection et la construction des fonctionnalités, la formation de plusieurs modèles, l’évaluation des performances du modèle et la sélection du meilleur modèle. .

    Image parGerd Altmann de Pixabay

    Dans un pipeline avec plusieurs étapes de prétraitement (imputation de valeur manquante, mise à l’échelle, PCA, sélection de caractéristiques, etc.), les hyperparamètres de tous les modèles et étapes de prétraitement, ainsi que diverses façons d’assembler ou d’empiler les algorithmes dans le pipeline.

    AutoML prend en compte divers algorithmes de machine learning (forêts aléatoires, modèles linéaires, SVM, etc.).

    L’avantage d’adopter AutoML est qu’il automatise le composant le moins engageant et le moins chronophage des processus d’apprentissage automatique. Il permet aux data scientists de se concentrer sur des tâches plus créatives et stratégiques plutôt que de perdre du temps à automatiser des étapes de modélisation laborieuses mais exigeantes en termes de calcul.

    L’inconvénient de l’utilisation d’AutoML est que l’ingénierie et le prétraitement automatisés des fonctionnalités peuvent rendre difficile de déterminer si un modèle est surajusté. De plus, une bonne performance ne vient pas nécessairement de l’automatisation de la formation du modèle.

    Pourquoi AutoML est-il le besoin du futur ?

    La demande de systèmes d’apprentissage automatique a considérablement augmenté au cours des dernières années du point de vue des applications. De nombreuses applications différentes ont intégré l’apprentissage automatique. Bien qu’il ait été démontré que l’apprentissage automatique peut améliorer le support pour certaines entreprises, de nombreuses entreprises ont encore des difficultés à déployer des modèles ML.

    Le remplacement de certains travaux humains est l’un des objectifs théoriques de l’IA. En particulier, l’adoption d’algorithmes appropriés peut aider à accomplir une partie importante du travail de conception de l’IA. En utilisant le réglage des paramètres comme illustration en utilisant une puissance de calcul accrue, des algorithmes tels que Bayes, NAS et la programmation évolutive peuvent être utilisés pour remplacer le travail humain dans le processus de réglage des paramètres.

    Une organisation a d’abord besoin d’une équipe de data scientists chevronnés qui exigent des salaires importants avant de déployer des modèles d’IA. Même si une entreprise dispose d’un personnel de premier ordre, le choix du modèle qui convient le mieux à l’entreprise nécessite souvent plus d’expérience que d’expertise en IA. Les systèmes d’apprentissage automatique, qui sont censés être conviviaux même pour les non-experts, sont de plus en plus demandés en raison du succès de l’apprentissage automatique dans une gamme d’applications. Avec une intervention humaine minimale, Automl a tendance à automatiser autant d’étapes de pipeline ML que possible tout en maintenant des performances de modèle élevées.

    Les trois principaux avantages de l’utilisation d’AutoML sont les suivants :

    • Exécutez automatiquement des tâches répétitives pour augmenter la productivité. En conséquence, les scientifiques des données peuvent désormais se concentrer davantage sur les problèmes que sur les modèles.
    • Les pipelines ML automatisés aident également à prévenir les erreurs potentielles provoquées par le travail manuel.
    • AutoML permet à quiconque d’utiliser des fonctionnalités de ML, ce qui constitue une étape importante vers la démocratisation de l’apprentissage automatique.

    Diverses plates-formes AutoML

    1. Auto-Sklearn

    Auto-Sklearn

    Un package Python open source appelé Auto-Sklearn a été créé pour automatiser les processus d’apprentissage automatique (AutoML). Il automatise la sélection de modèles et le réglage des hyperparamètres pour une gamme de classificateurs, de régressions et de techniques de clustering, ce qui est la partie la plus longue mais la moins excitante de l’apprentissage automatique. Les machines à vecteurs de support (SVM), les forêts aléatoires, les machines de renforcement de gradient (GBM), les k-means et d’autres techniques de ML sont mises en œuvre par Auto-sklearn.

    2. AutoKeras

    AutoKeras

    Grâce à une collection d’API Python de haut niveau, AutoKeras automatise les procédures de prétraitement, y compris l’extraction et la mise à l’échelle des fonctionnalités. L’utilisation d’AutoKeras a l’avantage d’automatiser toutes les activités d’apprentissage automatique difficiles, y compris le traitement des données, la sélection des modèles et le réglage des paramètres.

    3. HyperOpt

    Hyperopte

    Une bibliothèque open source pour AutoML à grande échelle s’appelle HyperOpt. La célèbre bibliothèque d’apprentissage automatique Scikit-Learn est prise en charge par HyperOpt-Sklearn, qui est un wrapper pour HyperOpt. Cela comprend la collecte des techniques de préparation des données et les méthodes de classification et de régression.

    4. Les briques de données

    briques de données

    Vous pouvez facilement créer des modèles de base et des blocs-notes à l’aide de Databricks AutoML. Grâce à l’utilisation de sa bibliothèque MLlib, qui automatise les tâches de prétraitement telles que l’extraction et la mise à l’échelle des fonctionnalités, il automatise l’apprentissage automatique. L’utilisation de Databricks AutoML a l’avantage d’automatiser toutes les activités d’apprentissage automatique difficiles, y compris le traitement des données, la sélection des modèles et le réglage des paramètres.

    5. Transmogriffes

    Transmogriffes TransmogrifAI est un package AutoML bien connu pour les projets d’apprentissage automatique qui est construit dans Scala et fonctionne au-dessus d’Apache Spark. Grâce à l’automatisation de l’apprentissage automatique et aux API, il est prévu d’augmenter la productivité des développeurs d’apprentissage automatique dans les projets ML. Il facilite la construction efficace de flux de travail d’apprentissage automatique modulaires et étroitement typés ainsi que la formation de modèles d’apprentissage automatique de haute qualité avec moins de modifications manuelles.

    6. MLBox

    MLBox

    Avec des fonctionnalités telles que la lecture rapide, la préparation ou le formatage de données distribuées, la sélection de fonctionnalités et la détection de fuites très robustes, l’optimisation précise des hyperparamètres et la prédiction avec interprétation de modèle, MLBox est un package AutoML bien connu pour les projets d’apprentissage automatique. Il se concentre sur l’optimisation des hyperparamètres, l’incorporation d’entités et l’identification des dérives.

    7. AutoML H20

    AutoML H20

    L’une des meilleures bibliothèques AutoML pour les applications d’apprentissage automatique est H20 AutoML, qui automatise la modélisation itérative, le réglage des hyperparamètres, la génération de fonctionnalités et la sélection d’algorithmes. Il facilite la formation et l’évaluation sans erreur des modèles d’apprentissage automatique. Il promet de réduire l’exigence de connaissances en apprentissage automatique pour améliorer les performances du projet.

    8. AutoGluon

    AutoGluon AutoGluon est une bibliothèque AutoML facile à utiliser et à étendre pour les projets d’apprentissage automatique. Il aide à automatiser l’assemblage de piles, l’apprentissage en profondeur, ainsi que les applications du monde réel couvrant des textes et des images. Il permet un prototypage rapide de modèles d’apprentissage en profondeur et d’apprentissage automatique avec quelques lignes de code et tire parti du réglage automatique des hyperparamètres.

    9.TPOT

    TPOT

    TPOT est un package AutoML bien connu pour trouver automatiquement des modèles d’apprentissage automatique de premier ordre pour les travaux nécessitant une modélisation prédictive. Il s’agit d’une bibliothèque open source avec des modèles d’apprentissage automatique et le framework de préparation de données scikit-learn. Il s’agit d’un outil Python AutoML permettant de modifier génétiquement les processus d’apprentissage automatique. Le pipeline le plus approprié parmi des milliers de pipelines potentiels est utilisé pour automatiser les processus répétitifs et fastidieux.

    10. Auto ViML

    Auto-ViML

    Parmi les énormes bibliothèques AutoML, les tâches d’apprentissage automatique sont effectuées à l’aide d’Auto-ViML. Son but était de créer des modèles hautement efficaces et interprétables en utilisant moins de variables. Avec une seule ligne de code, plusieurs projets d’apprentissage automatique peuvent être créés automatiquement. Ce package AutoML possède des fonctionnalités intéressantes, notamment SMOTE, Auto NLP, les variables de temps de données et l’ingénierie des fonctionnalités.

    11. Louis

    Louis

    À l’aide d’un mécanisme de configuration simple et adaptable basé sur les données, le framework d’apprentissage automatique déclaratif Ludwig simplifie la conception de pipelines d’apprentissage automatique. La Linux Foundation AI and Data héberge Ludwig, qui peut être utilisé pour un large éventail d’activités d’IA.

    Les fonctionnalités d’entrée et de sortie, ainsi que les types de données appropriés, sont déclarés dans la configuration. Des paramètres supplémentaires peuvent être spécifiés par les utilisateurs pour prétraiter, encoder et décoder des fonctionnalités, charger des données à partir de modèles pré-formés, créer l’architecture du modèle interne, ajuster les paramètres de formation ou effectuer une optimisation des hyperparamètres.

    Ludwig créera automatiquement un pipeline d’apprentissage automatique de bout en bout à l’aide des paramètres explicites de la configuration tout en revenant aux valeurs par défaut intelligentes pour les paramètres qui ne le sont pas.

    12. Amazon Transcription

    Amazon TranscriptionEn utilisant une méthode d’apprentissage en profondeur connue sous le nom de reconnaissance automatique de la parole (ASR), Amazon Transcribe permet aux développeurs d’ajouter facilement des fonctionnalités de synthèse vocale à leurs applications.

    En outre, AWS propose Amazon Transcribe Medical, qui permet aux applications de documentation clinique de convertir la parole médicale en texte.

    En mettant l’accent sur l’assemblage automatique de piles, l’apprentissage en profondeur et les applications pratiques couvrant le texte, l’image et les données tabulaires, AutoGluon offre un AutoML simple à utiliser et simple à étendre.

    Les principaux avantages d’Amazon Transcribe sont :

    • Créez des transcriptions faciles à lire
    • Filtrer des mots spécifiques
    • Augmentez la précision avec des transcriptions personnalisées

    Voici quelques exemples de cas d’utilisation d’Amazon Transcribe :

    • Expérience client
    • Analyse post-appel
    • Documentation de conversation clinique
    • Workflows de sous-titrage et de sous-titrage
    • Catalogage des archives audio

    13. Robot de données

    Robot de données

    Pour les modèles prédictifs, DataRobot propose un apprentissage automatique automatisé à la demande. En utilisant toutes les données disponibles, il effectue automatiquement l’ingénierie des fonctionnalités, la sélection du modèle et l’optimisation des hyperparamètres…

    Share. Facebook Twitter Pinterest LinkedIn WhatsApp Reddit Email
    Add A Comment

    Leave A Reply Cancel Reply

    Catégories

    • Politique de cookies
    • Politique de confidentialité
    • CONTACT
    • Politique du DMCA
    • CONDITIONS D’UTILISATION
    • Avertissement
    © 2023 DéveloppeurWeb.Com.

    Type above and press Enter to search. Press Esc to cancel.