Zillow se lance dans l'IA avec un «réseau de neurones»

zillow-neural-network

Depuis sa création en 2006 à Seattle, Zillow a utilisé un algorithme exclusif et une équipe de statisticiens pour créer son célèbre «Zestimates» destiné à l'immobilier. La société a déployé sa première version en 2006, suivie de deux mises à niveau majeures en 2008 et en 2011. Elle a continué à améliorer son système avec des améliorations déployées au cours du processus sous la forme d'itérations incrémentielles. Le logiciel conçu par le statisticien utilise un processus automatisé et dépend de la quantité de données disponibles pour l'emplacement.

Le taux d'erreur médian pour la société s'établit à 4,5%, ce qui signifie essentiellement que la moitié des maisons se situeront dans une plage de 4,5% et que la moitié des maisons bénéficiera d'une marge d'erreur de 4,5% en ce qui concerne le prix de vente. La société utilise des enregistrements publics pour rassembler ses données. Les maisons disposant d'informations actuelles ont donc plus de chances de voir leurs valeurs immobilières estimées en fonction des tendances actuelles en matière de données. La méthode est un modèle d'apprentissage de réseau neuronal non linéaire comprenant plusieurs variables à partir de données de ventes récentes d'unités de logement dans un comté donné.

Zillow utilise des statistiques et des données de marché, appelées ensembles de données, pour estimer la valeur marchande des maisons. Leurs évaluations sont automatiquement calculées trois fois par semaine, en se basant sur les millions de points de données soumis par les utilisateurs et collectés dans des archives publiques, telles que les bureaux des enregistreurs de comté et les bureaux du département des évaluations. L’évaluation immobilière présente naturellement un grand intérêt pour le monde de l’économie financière.

Le cerveau humain et sa capacité de traitement des données sont la motivation pour créer des systèmes de réseaux neuronaux. Le réseau de neurones biologiques est essentiellement un ensemble d'unités interconnectées qui traitent des informations en fonction de la force des connexions inter-unités et qui s'adaptent à des ensembles de modèles d'apprentissage ou en tirent parti.

Les bases du réseau de neurones

Pour comprendre ce qu'est un réseau neuronal artificiel, il est possible d'utiliser l'algorithme Microsoft Neural Network pour un bref tutoriel. Cet algorithme a jusqu'à trois couches de neurones dans un réseau. Ces couches comprennent:

  • La couche d'entrée définit toutes les valeurs d'attribut d'entrée pour le modèle d'exploration de données et les probabilités. Cette couche se rapproche des dendrites de neurones humains, qui transmettent des signaux au noyau.
  • La couche en sortie représente les valeurs d'attribut prévisibles pour le modèle d'exploration de données - Cette couche se rapproche de l'axone du neurone humain, qui achemine les signaux
  • Une couche cachée facultative - des poids relatifs sont attribués aux entrées pour leur importance et leur pertinence - Cette couche se rapproche des synapses des neurones humains qui changent de taille en réponse à l'apprentissage et ont fourni la base du concept de mémoire associative

Les couches fonctionnent ensemble pour fonctionner de manière similaire aux neurones humains, en prenant en compte les informations et en prenant des décisions en fonction de ces informations. La différence est que les neurones humains sont capables de prendre des décisions beaucoup plus sophistiquées basées sur de grandes quantités d'informations variées, avec beaucoup plus de interactions variables et complexes résultant de caractéristiques émotionnelles et spirituelles humaines que les machines n'ont pas. De plus, les neurones artificiels n'atteignent finalement aucun changement d'apprentissage, même s'ils peuvent continuer à fonctionner. En résumé, le réseau de neurones fonctionnera efficacement avec les données, mais il ne peut fonctionner que de même que la qualité des données et des paramètres saisis par l'opérateur, et cela dépend de la quantité de variabilité qu'il doit gérer. Les chercheurs ont découvert que les erreurs de prévision peuvent être plus élevées avec une grande variabilité des données.

Une utilisation innovante des photographies numériques

Ce qui rend le réseau de neurones de Zillow intéressant, c’est que les scientifiques de Zillow Group Data travaillent avec les aspects visuels des maisons pour développer des programmes informatiques suffisamment complexes pour en estimer les valeurs. Les programmes utilisent des photographies et une technologie complexe pour imiter la manière dont les images sont traitées par le cerveau humain. Les énormes bases de données photographiques existantes en ligne sont exploitées à l'aide des progrès de l'informatique en nuage et de l'apprentissage en profondeur afin de créer de nouveaux réseaux neuronaux qui se concentrent sur la détection d'attributs spécifiques à la maison comme aides à l'estimation de valeurs.

Les systèmes informatiques de Zillow sont en train d'être formés pour corréler les différences entre les pixels d'une image sur une photographie. Les scientifiques ont développé des collections spécifiques et leur ont attribué des signaux de valorisation. Lorsque le réseau de neurones détecte les différences entre les matériaux de construction d'une maison sur les photographies, il génère automatiquement une différence de prix. Une variété de fonctions domestiques dans les photos sera utilisée pour extraire les signaux d’évaluation du réseau de neurones.

Le scientifique devra créer de vastes quantités de nouveau code pour le réseau de neurones afin de différencier ce que les humains peuvent facilement déduire en jetant simplement un coup d'œil sur les photographies. C’est une tâche énorme qui nécessite que la société développe des composants de réseau extrêmement complexes. Le groupe Zillow utilise Amazon Web Services pour accéder à l'incroyable puissance nécessaire au développement de ce type de nouvelle technologie. Basés sur le cloud et utilisant beaucoup d’informatique, les unités de traitement graphique permettent de rendre abordable et possible ce qui n’était pas auparavant.

Le directeur des analyses de Zillow, Stan Humphries, supervise cent personnes dans sa division. Ses scientifiques en analytique ont mis au point des algorithmes spécifiques pour ce type de technologie, mais les ont rejetés car ils étaient irréalisables à l'époque. Ils utilisaient trop d'informatique. Mais la société a pu accéder aux avancées de la recherche en apprentissage approfondi en utilisant cette approche pour intégrer des données d’image dans le célèbre algorithme de Zillow Zestimate. En raison des progrès considérables réalisés dans les technologies informatiques et des services en nuage étendus mais abordables, la société espère pouvoir commencer à utiliser avec succès le réseau de neurones nouvellement développé au premier trimestre de 2017.

Depuis sa création, Zillow a utilisé les itérations de son algorithme incrémental exclusif pour réduire les taux d’erreur de valorisation de 14% à 4,5%. À l'aide de son énorme base de données de 115 millions de domiciles, provenant de propriétés situées aux États-Unis, la société a mis en œuvre avec succès des modèles d'apprentissage automatique et des statistiques sur des centaines de points de données variés afin de fournir des évaluations immobilières. Ces points d’examen comprennent la superficie en pieds carrés, le nombre de chambres, le nombre de salles de bains, la taille des lots, les transactions récentes de maisons similaires dans la région et de nombreuses autres caractéristiques populaires auprès des propriétaires et des acheteurs. Le plan pour l’avenir de Zillow consiste à utiliser son réseau de neurones extrêmement complexe et récemment mis au point pour ajouter des photographies.

Avantages immobiliers attendus

Les humains peuvent voir les différences dans les matériaux utilisés dans la construction et la décoration de la maison. En personne et en regardant des photographies, l’œil humain peut déterminer si le plancher est en bois ou en carreaux, si les étagères sont en bois ou en acier inoxydable, ou si les plans de travail sont en pierre ou en stratifié. La qualité des matériaux est facilement quantifiée et stockée dans le cerveau humain, et la perception de la valeur est augmentée ou diminuée. Le défi pour Zillow a été d’atteindre ce niveau de perception humaine au sein de leurs systèmes informatiques.

Bien que les réseaux de neurones existent depuis des décennies et que leur fonction repose sur la biologie humaine, ils n’ont jamais été en mesure d’atteindre les capacités complexes d’inférence et de perception que l’homme prend pour acquis. Ce qui est excitant pour Zillow, et pour le marché immobilier en général, est que la nouvelle intelligence artificielle (AI) en développement peut apporter des améliorations substantielles de la précision de l'évaluation et peut-être même des augmentations des transactions de vente.

Alors que les entreprises cherchent à faire de meilleures affaires, les technologies d’IA sont de plus en plus adoptées. La raison est simple. Ces progrès de l'intelligence artificielle se rapprochent davantage de la façon dont les humains raisonnent rapidement. De la même manière que les synapses neuronales humaines changent de taille en réponse à l'apprentissage, les couches de neurones informatiques sont scientifiquement modifiées pour fournir des réponses d'apprentissage plus précises. C’est une période passionnante pour la science et les affaires.

Loading ..

Recent Posts

Loading ..