Avertir le modérateur

18/02/2019

Fondations Data Science. Levels of Understanding Data.Connaître la structure des données.Connaître les bizarreries de données d'entreprise.

The World is our Workplace. Let's work togheter.ArchiveFW21siècle>DU TEMPS QUI PASSE:Présent,Passé,Futur

Fondations Data Science: Connaissez vos données. Vraiment, vraiment, le savoir

Accéder au profil de Randy Au
 
Connaissez vos données, leur provenance, leur contenu et leur signification. Tout commence à partir de là.
S'il y a un conseil que je donne régulièrement à chaque personne qui débute dans le traitement des données, qu'il s'agisse d'un analyste, d'un scientifique ou d'un visualiseur, c'est bien ça.
C’est la colline sur laquelle je passe la plus grande partie de mon temps, jusqu’à l’obsession. C'est un trou de lapin deeeeeeep mais éminemment important.

Mais pourquoi?

Je ne pense pas avoir rencontré de praticien qui croit être familier avec un ensemble de données et les systèmes environnants, c'est facultatif, mais c'est quelque chose qui amène des personnes qui ne sont pas familières avec le domaine et qui se laissent aller.

La vie n'est pas une entrée de week-end Kaggle décontractée. Lancer une forêt aléatoire sur vos données de travail est à peu près aussi efficace que de lancer un bonsaï sur votre serveur de base de données. Cela blesse votre serveur et laisse la saleté partout pour que vous puissiez la nettoyer.

Bien que vos collègues en affaires ne soient pas des informaticiens, ils ne sont pas idiots (espérons-le). Ce sont des experts du domaine qui en savent beaucoup sur l'entreprise. Ne soyez pas l'analyste subalterne présentant au PDG une nouvelle découverte brillante à laquelle on vous pose la question "Alors, avez-vous retiré les 3 comptes de contrats à volume élevé spéciaux que nous avons?", Ne finit pas bien. Faites-moi confiance.

Que signifie "connaître vos données"?

Il y a beaucoup de couches à cela. Je vais entrer dans chaque couche en détail. Vous pouvez également vous joindre à moi pour revisiter les traumatismes du passé à tous les niveaux.

Levels of Understanding Data

Data Layout.png

 L'oignon de la connaissance des données. Les choses se compliquent à mesure que vous sortez.

La couche la plus simple consiste à connaître la structure des données - son emplacement, son organisation. Dans un contexte Data Science, il s'agit généralement d'une base de données ou d'une archive de journal, peut-être de deux services tiers et du schéma défini. Combien y a-t-il de magasins de données, que contiennent-ils? Quels sont les champs, quels sont le schéma de la table et les relations. Structure de base et substance de définition.

Vient ensuite ce que sont les bizarreries et les pièges dans des données individuelles. Est-ce que les données suivent le schéma, y ​​a-t-il des erreurs historiques et des artefacts étranges? Où sont les pièges (il y a TOUJOURS des pièges).

Il y a ensuite des problèmes commerciaux concernant les données. Comptes de test internes, partenariats spéciaux avec offres spéciales, pratiques de traitement, de comptabilité et de sécurité exigeant des implémentations spécifiques, etc.

Une autre étape plus profonde est la manière dont ces données sont collectées, d’où proviennent-elles. Quels systèmes l'ont généré, quelle logique et quelle technologie se cache derrière la création et l'enregistrement.

Enfin, les choses se gâtent en demandant pourquoi des données ont été collectées et ce qui ne l’a pas été. Pourquoi certaines mesures ont-elles été choisies par rapport à d'autres?

Combien de temps ce processus prend-il normalement?

Ça dépend

Je m'attends généralement à environ 3 à 6 mois d'interrogation et d'utilisation quotidienne de l'ensemble de données avant de me sentir assez à l'aise pour affirmer connaître les principes fondamentaux d'un système comportant environ une douzaine de tables de base critiques + un couple. de douze tables de soutien. Entreprises de taille moyenne / matériel au niveau du système.

Évidemment, cela dépend aussi de la quantité de données, du nombre de systèmes, etc. Il faut parfois des années pour «maîtriser» un système, pour que des personnes le modifient constamment.

# 1 Connaître la structure des données

Il s’agit essentiellement d’enjeux de savoir ce qui est disponible. Vous devez simplement savoir cela pour même commencer à travailler.

Mais si vous grattez un peu plus profondément, vous constaterez que les nuances sont nombreuses. Existe-t-il des contraintes de clé étrangère? La base de données est-elle configurée comme un OLTP ou un OLAP? La structure des données a-t-elle beaucoup changé au fil du temps, comment se sont déroulées ces migrations et mises à jour? Quel est le codage de texte et le fuseau horaire par défaut? (Regardez, il fut un temps où UTF-8 n'était pas la valeur par défaut.)

Quels champs sont générés automatiquement (champs auto-incrémentés, schémas de partage, horodatage qui se met à jour automatiquement, etc.). Quels sont les index pertinents sur les tables. Quels sont les types de données et comment tout est-il appliqué? (J'ai passé des années dans un gros environnement MySQL, puis dans un environnement de journalisation géant, c'est une préoccupation majeure.)

Les choses deviennent encore plus amusantes lorsque vous avez des environnements de production plus complexes. La base de données est là, les journaux bruts y sont, les journaux traités sont là, les outils tiers utilisent autre chose, Hadoop habite sur un autre ensemble de boîtes, et nous avons aussi des choses dans le cloud? Avez-vous même toutes les informations d'identification pour accéder à la substance? Sont-ils en cours d'exécution sur la même horloge? Comment diable allez-vous rejoindre ce genre de choses ensemble? Sur quel (s) système (s) allez-vous joindre ce genre de choses ensemble? Allez-vous devenir fou en essayant de faire ces jointures? (Indice: probablement)

Pourquoi cette couche est importante pour vous

Vous devez vous familiariser avec tout cela pour pouvoir faire votre travail. C'est comme savoir où se trouvent tous les ingrédients de la cuisine. Négocier l'accès peut être un cauchemar dans certaines organisations, et vous devez alors tout organiser dans un endroit où vous pouvez faire votre travail.

À un niveau plus profond, il existe souvent plusieurs façons de mesurer quelque chose: une vente peut être enregistrée dans l'entrepôt de données, mais également dans la table des commandes de base, et elle laisse des traces dans les journaux bruts du serveur. Il y a des couches de traitement entre les deux, ces détails pourraient être importants un jour.

2 Connaissez vos enregistrements de données

La première chose que je fais lorsque j'accède à une table de données est d'exécuter SELECT * LIMIT 5 dessus. Je ne me soucie généralement pas de décrire. Regarder quelques lignes réelles est plus informatif.

Jouez avec les données assez longtemps et vous rencontrerez des choses étranges. Même dans le monde structuré d'une base de données relationnelle, vous pouvez trouver toutes sortes de bizarreries. Les choses deviennent encore plus folles dans les journaux arbitraires. Voici quelques exemples mémorables:

Les valeurs NULL sortent juste de manière aléatoire pour vous permettre de le savoir lorsque vous le soupçonnez le moins. Si un champ n'est pas codé en dur comme étant non NULL, je m'attends maintenant à trouver des valeurs NULL

Les entiers sont utilisés comme masques de bits pour stocker les indicateurs de préférence parce que quelqu'un sur Eng a pensé que ce serait bien et compact. Les opérations bit à bit en SQL constituent une dimension supplémentaire de plaisir. Les discussions ont eu

Nombreux types d'horodatage: chaîne ISO avec / sans tz, unixtimes précis en microsecondes sous forme d'entiers 64 bits, horodatages réels utilisant le type interne

 

  • JSON stocké en texte brut car la base de données ne prend pas encore en charge JSON
  • JSON tronqué car nous avons oublié que les champs TEXT ont une longueur finie
  • Entrées d'identifiants en double dans un système où les dupes ne devraient pas se produire - sur une table de revenus principale
  • Encodage de texte endommagé
  • Surprise t, n, r, c caractères dans les chaînes d’agent utilisateur encrassant un pipeline csv
  • Une secousse a réussi à mettre 0 dans une chose
  • Les noms de champ qui sont réutilisés pour un usage complètement différent parce que Eng ne voulait pas exécuter ALTER en raison d'un temps d'arrêt. (Vous savez qui vous êtes, champ "logo")
  • Dumps de données du code COBOL du gouvernement sur un ordinateur central quelque part
  • ID orphelins, car personne n'utilise vraiment les contraintes de clé étrangère
  • Tout le plaisir que vous pouvez imaginer et bien plus encore

Traiter avec cette couche

La folie absolue de cette couche explique pourquoi la plupart des utilisateurs de données semblent passer la majorité de leur temps à nettoyer et à préparer les données . Entre les bogues introduisant des données erronées, les utilisateurs malveillants / naïfs qui vous donnent des données étranges et la mauvaise conception occasionnelle d'un système, la liste est illimitée.

Nous n'avons même pas envisagé ce qui se passerait si vous exploriez le Web ou si vous deviez extraire des données d'un fichier PDF ou d'une "feuille de calcul au format Excel".

En fait, ma définition idiote de scientifique junior en informatique est une personne qui ne cède pas violemment à l’idée de mettre une zone de texte ouverte sur Internet.

La plupart de ces problèmes de données vont probablement bloquer le code que vous écrivez pour effectuer une analyse. ce qui est généralement une bonne chose. Si vous êtes assez chanceux (malchanceux?) Pour que votre code soit exécuté malgré des données étranges, cela invalidera toutes les conclusions que vous tirerez et vous devrez être au courant pour comprendre ce qui s'est passé.

En cas de doute, demandez à d'autres personnes si vous voyez des données étranges. C'est très souvent un bug qui devrait être corrigé.

Connaître les bizarreries de données d'entreprise

Les entreprises collectent souvent d'étranges cas particuliers en cours de route. Ces cas particuliers peuvent vous faire trébucher encore plus dur qu'un NULL aléatoire dans votre champ d'identification.

Ils sont dangereux car ils se manifestent sous forme de points de données valides, mais leur comportement est radicalement différent.

Voici des exemples de ceux que j'ai vus:

 

  • Les utilisateurs internes, pour les tests, les employés ou les «amis de l'entreprise» utilisent. Ils utilisent probablement les choses différemment de tout le monde
  • Partenaires stratégiques, ils ont peut-être des quotas et une activité énormément plus importants et sont facturés à prix réduit
  • Comptes revendeurs qui contrôlent efficacement 50 comptes d'activité sous un seul compte
  • Calendriers en général. Les jours fériés vont déconner avec vos données, les durées mensuelles avec vos agrégations. J'ai une haine brûlante pour Pâques uniquement parce que c'est une date différente chaque année et me permet de faire des comparaisons d'une année à l'autre deux fois par an.

Comment traiter avec cette couche

Les experts de domaine et les partenaires de l’ensemble du secteur sont la clé pour traiter ce type de données. Toutes ces choses font partie des connaissances institutionnelles que vous devez exploiter pour donner un sens aux données que vous voyez.

Votre seul autre garde-corps est la vigilance à propos de la répartition de l'activité et des utilisateurs. Ces entrées de cas spéciaux ont tendance à se distinguer d'un client plus typique, de sorte que vous pouvez les rechercher comme s'il s'agissait d'un gros client, puis être corrigées à mi-parcours.

Savoir d'où proviennent les données, comment elles sont générées et définies

En science, nous sommes supposés documenter méticuleusement comment les données ont été collectées et traitées, car les détails de ce processus de collecte sont importants. Des tonnes de recherches ont été invalidées, car il y avait une faille dans la manière dont les données ont été rassemblées et utilisées. Dans notre cas, les implémentations technologiques comptent beaucoup ici, alors éclatez votre chapeau.

Est-ce que vous dépendez des cookies? Cela signifie que les gens peuvent les effacer, les bloquer ou ils expirent à cause d'un TTL court. Les gens utilisent plusieurs navigateurs et appareils. Un exemple simple: "cookie unique" n'est pas la même chose que "utilisateur humain unique", mélangez-les et vous passerez un mauvais moment.

Utilisez-vous du code JavaScript frontal pour envoyer des événements tels que des clics et des défilés à vos systèmes? Est-ce que ça marche sur tous les navigateurs? Parfois, souvenez-vous que les gens bloquent le javascript et que les robots exécutent rarement JS. Qu'est-ce qui attrape les événements chez nous? Quelle machine enregistre le temps? Les événements se déclenchent-ils juste avant ou juste après l'API nous intéressent-ils?

Si des éléments sont suivis dans la base de données, quand la mise à jour aura-t-elle lieu? Est-ce que tout est emballé dans une transaction? Les drapeaux d'état changent-ils de façon monotone ou librement? Quelle est la logique métier dictant les changements d'état? Est-il possible d'obtenir des entrées en double?

Comment votre structure de tests A / B affecte-t-elle les sujets, attribue-t-elle réellement des variantes de manière aléatoire, sans biais? Les événements sont-ils comptés correctement?

Données géospatiales? Amusez-vous avec les définitions des régions métropolitaines, la manipulation des codes postaux. Le comté de Queens, dans l'État de New York, regroupe une foule de noms plus petits.

Données IP? N'oubliez pas les adresses IP, NAT et VPN dynamiques et leur interaction avec les appareils mobiles. En outre, les géolocalisations ne sont que des tables de recherche très complexes fournies par une poignée de fournisseurs.

Capteurs physiques? Maintenant, vous avez des effets d'étalonnage et d'usure, des défaillances et l'environnement réel qui vous gêne.

Gérer cette couche

Comme vous pouvez le constater, les détails spécifiques importent beaucoup. À ce stade, vous vérifiez l'intégrité de la logique derrière les données existantes. Vous devez être extrêmement conscient de la myriade de biais et de bugs présents dans les données afin de savoir exactement ce que vous pouvez raisonnablement dire. Ces détails vont souvent faire ou défaire un modèle. Tout ce qui parle de partialité dans l'IA / ML commence ici.

Les experts du domaine rechercheront ces détails et vous devrez exploiter leurs précieuses connaissances. Il est difficile de battre le savoir institutionnel collectif dans ce domaine.

Vous pouvez vous aider à découvrir ces problèmes en examinant attentivement vos données, en vérifiant les distributions, en vous demandant pourquoi elles ont cet aspect.

Au fil du temps, vous devriez être en mesure de comprendre ce que les ingénieurs essayaient d'accomplir en examinant simplement la structure et les données de la table de données. Il s’agit d’un journal des transactions, d’une piste de vérification des modifications de paramètres, des commandes passées ici et pouvant contenir plusieurs envois. Les codes de statut sont mis à jour de cette manière. Un ordre de progression est garanti, mais pas un autre.

Avec cette idée de l'intention d'une table, vous pouvez trouver toutes sortes de bogues intéressants, dont beaucoup ne seront pas remarqués par d'autres ingénieurs.

Connaître les décisions de collecte en cours

Pendant tout ce temps, je parlais des données collectées. Il y a encore un grand vide, tout ce qui n'a pas été collecté.

Quelqu'un a fait le choix, conscient ou inconscient, de collecter une donnée et non une autre. Il est important de connaître ces angles morts si vous craignez des biais dans vos données et vos modèles.

Ces décisions découlent souvent de considérations pratiques. Quelque chose est impossible à collecter ou nous avons décidé de ne pas le protéger, pour des raisons éthiques ou parce que nous ne pensons pas que cela serait utile. Cela provient rarement d'une malveillance ouverte, mais les effets d'une mauvaise utilisation des données peuvent être désastreux.

Par exemple, nous ne pouvons collecter que des données sur nos propres utilisateurs car, par définition, les non-utilisateurs n'utilisent pas notre produit. Il y a là un biais d'auto-sélection, ce qui crée des problèmes lorsque vous construisez un nouveau produit ou entrez sur un nouveau marché. Les affaires sont jonchées de cadavres peu accessibles sur de nouveaux marchés. Ensuite, il y a tous les résultats extrêmement dérangeants d'algorithmes donnant des résultats biaisés et racistes utilisés de manière très douteuse.

Si vous connaissez des angles morts, vous pouvez activement prendre des mesures pour y remédier, mais uniquement si vous savez qu'il existe un problème. Peut-être que vous allez collecter plus de données, ou rééquilibrer les données existantes. Parfois, il suffit de conclure que quelque chose est une idée horrible et qu’il devrait être abandonné.

Tout ce que nous faisons n’est pas controversé, mais nous utilisons tous des algorithmes pour choisir les gagnants et les perdants. Nous devons prendre cette responsabilité au sérieux.

Continue d'apprendre

Vous n'allez jamais avoir des données parfaites ni une compréhension parfaite de toutes vos données. Juste au moment où vous pensez maîtriser quelque chose, une nouvelle fonctionnalité a été ajoutée: les normes changent, les systèmes sont supprimés. Continuez simplement à apprendre, documentez ce que vous pouvez, laissez des traces sur papier pour vos analyses et continuez.

 

 

 

«L’atelier de Dartmouth» a lancé la quête de l’intelligence artificielle qui dure depuis plusieurs décennies. Dans les années suivantes, la poursuite échoua, traversant plusieurs «hivers»ABC pour 2019

SMITHSONIAN MAGAZINE | April 2018

In June of 1956, A few dozen scientists and mathematicians from all around the country gathered for a meeting on the campus of Dartmouth College. Most of them settled into the red-bricked Hanover Inn, then strolled through the famously beautiful campus to the top floor of the math department, where groups of white-shirted men were already engaged in discussions of a “strange new discipline”—so new, in fact, that it didn’t even have a name. “People didn’t agree on what it was, how to do it or even what to call it,” Grace Solomonoff, the widow of one of the scientists, recalled later. The talks—on everything from cybernetics to logic theory—went on for weeks, in an atmosphere of growing excitement.


SMITHSONIAN MAGAZINE | Avril 2018

En juin 1956, quelques dizaines de scientifiques et de mathématiciens de tout le pays se sont réunis pour une réunion sur le campus du Dartmouth College. La plupart d'entre eux se sont installés dans le Hanover Inn aux briques rouges, puis se sont promenés dans le célèbre campus, au dernier étage du département de mathématiques, où des groupes d'hommes en chemise blanche étaient déjà engagés dans des discussions sur une «nouvelle discipline étrange». en fait, il n'avait même pas de nom. «Les gens n'étaient pas d'accord sur ce que c'était, comment le faire ou même comment l'appeler», a rappelé plus tard Grace Solomonoff, la veuve d'un des scientifiques. Les discussions - sur tout, de la cybernétique à la théorie de la logique - ont duré des semaines, dans une atmosphère d'excitation croissante.

Les scientifiques parlaient dans leur cachette de Sylvan de la manière de construire une machine capable de penser.

«L’atelier de Dartmouth» a lancé la quête de l’intelligence artificielle qui dure depuis plusieurs décennies. Dans les années suivantes, la poursuite échoua, traversant plusieurs «hivers» où elle semblait vouée à l'impasse et à des déceptions déconcertantes. Mais aujourd'hui, les nations et les entreprises investissent des milliards dans AI, dont les progrès récents ont même surpris les scientifiques travaillant dans ce domaine. Ce qui était autrefois un dispositif de complot dans des films de science-fiction est en train de naître.

Les hedge funds utilisent l'IA pour battre le marché boursier, Google l'utilisent pour diagnostiquer les maladies cardiaques plus rapidement et plus précisément, et American Express déploie des robots d'IA pour servir ses clients en ligne. Les chercheurs ne parlent plus d'une seule IA, mais de centaines, chacun spécialisé dans une tâche complexe - et de nombreuses applications déjouent déjà les humains qui les ont créées.

«L'apprentissage automatique» est apparu ces dernières années comme la nouvelle voie à suivre. Les algorithmes, libérés des programmeurs humains, s’entraînent eux-mêmes sur des jeux de données volumineux et produisent des résultats qui ont choqué même les optimistes sur le terrain. Plus tôt cette année, deux IA - l'une créée par la société chinoise Alibaba et l'autre par Microsoft - ont battu une équipe de concurrents à deux jambes lors d'un test de compréhension de la lecture à Stanford. Les algorithmes «lisent» une série d'entrées dans Wikipedia sur des sujets tels que la montée de Gengis Khan et le programme spatial Apollo, puis répondent à une série de questions à leur sujet avec plus de précision que les gens le faisaient. Un scientifique d'Alibaba a déclaré que la victoire était un "jalon".

Ces IA dites "étroites" sont omniprésentes, intégrées à vos systèmes GPS et aux recommandations d'Amazon. Mais le but ultime est l’intelligence générale artificielle, un système d’auto-apprentissage capable de surpasser les humains dans de nombreuses disciplines. Certains scientifiques pensent que dans 30 ans, d'autres parlent de siècles. Ce «décollage» de l'IA, également connu sous le nom de singularité, permettra probablement à l'IA de tirer, même avec l'intelligence humaine, et de la dépasser en quelques jours. Ou des heures.

Une fois qu’elle aura été livrée, l’intelligence artificielle commencera à supprimer des emplois, des millions d’emplois: conducteurs, radiologues, experts en sinistres. Dans un scénario possible, cela conduira les gouvernements à verser aux citoyens sans emploi un revenu de base universel, les libérant ainsi de poursuivre leurs rêves, libérés de la nécessité de gagner leur vie. Dans un autre, cela créera des inégalités de richesse stupéfiantes, le chaos et des États en faillite à travers le monde. Mais la révolution ira beaucoup plus loin. Des robots de l'IA s'occuperont des personnes âgées - des scientifiques de la Brown University collaborent avec Hasbro pour mettre au point un «robot robot» capable de rappeler à ses propriétaires de prendre leurs médicaments et de retrouver leurs lunettes. Les «scientifiques» de l'IA vont résoudre le casse-tête de la matière noire; Les engins spatiaux compatibles avec l'IA atteindront les ceintures d'astéroïdes, tandis que sur Terre, la technologie permettra de maîtriser le changement climatique, peut-être en envoyant une série d'essaims de drones pour réfléchir la lumière du soleil loin des océans. L'année dernière, Microsoft a consacré 50 millions de dollars à son programme «AI for Earth» pour lutter contre le changement climatique.

«Les IA vont coloniser et transformer le cosmos dans son ensemble», déclare Juergen Schmidhuber, un informaticien pionnier basé à l'Institut pour l'intelligence artificielle de Dalle Molle en Suisse, et le rendra intelligent.

Mais qu'en est-il de nous? "Je m'inquiète d'un scénario dans lequel l'avenir est l'intelligence artificielle et où les humains sont laissés pour compte", a déclaré David Chalmers, professeur de philosophie à l'Université de New York. "Si le monde était envahi par des robots inconscients, ce serait un scénario aussi désastreux et aussi sombre qu'on pourrait l'imaginer." Chalmers n'est pas seul. Bill Gates et Elon Musk, deux des plus gros frappeurs de l'ère de l'informatique, ont mis en garde contre le fait que les IA détruisent la planète dans une quête effrénée de leurs propres objectifs ou se débarrassent des humains par accident, ou pas par accident.

En approfondissant le sujet de l'IA au cours de l'année écoulée, j'ai commencé à paniquer à propos de l'éventail des possibilités. On aurait dit que ces machines étaient en voie de rendre le monde incroyablement cool et bon ou horrible. Ou mettre fin à la race humaine tout à fait. En tant que romancier, je souhaitais inventer ce à quoi l'avenir de l'IA pourrait ressembler, en interrogeant plus d'une douzaine de futuristes, philosophes, scientifiques, psychiatres culturels et innovateurs technologiques. Voici mes cinq scénarios (note de bas de page avec les commentaires des experts et de moi-même; cliquez sur le texte en surbrillance bleu pour les lire) pour l'année 2065, dix ans après l'arrivée de la singularité.

Droits surhumains

Imaginez un jour que vous demandiez à votre système de poignet Soulband compatible avec l'IA de syntoniser une émission de la Cour suprême, où des avocats discutent du cas le plus attendu de l'année. Une AI appelée Alpha 4, spécialisée dans la sécurité et l'exploration de l'espace, a présenté la requête, exigeant qu'elle soit considérée comme une «personne» et compte tenu des droits dont jouit chaque Américain.

Bien sûr, les AI ne sont pas autorisés à se disputer devant les juges. Alpha 4 a donc engagé de nombreux avocats pour le représenter. Et maintenant, ils affirment que leur client est aussi vivant qu’ils le sont. Cette question: une IA peut-elle vraiment être consciente? … Est au cœur de l'affaire.

Lorsque vous écoutez la diffusion, les manifestants qui se trouvent à l'extérieur crient: «Hé hé, ho ho, avec les seigneurs de l'IA.» Certains d'entre eux ont menacé d'attaquer. Les centres de données si les IA deviennent des personnes. Ils sont en colère - et ont très peur - parce que c'est la productivité des IA et des robots qui est taxée, et non le travail des êtres humains. Les 2 300 dollars déposés chaque mois sur leurs comptes bancaires dans le cadre du revenu de base universel, leur assurance maladie gratuite, les études hyper personnalisées que leurs enfants reçoivent au collège et une centaine d'autres choses merveilleuses sont tous payés par des AS comme Alpha 4. les gens ne veulent pas que cela change. En 2065, la pauvreté est un mauvais souvenir.

 

Bien sûr, le monde a perdu des portions de la ville de New York - et 200 000 New-Yorkais - lors des soulèvements de 2057-5 '59, alors que TriBeCa et Midtown ont été complètement brûlés par les habitants de Westchester et du sud du Connecticut. appauvrissement. Mais c'était avant l'UBI.

Si Alpha 4 gagne son procès, cependant, il contrôlera son argent. Il préférera peut-être dépenser de l'argent pour construire des vaisseaux spatiaux pour atteindre Alpha Centauri plutôt que pour acheter de nouveaux parcs aquatiques à Santa Clara et Hartford. Personne ne sait vraiment.

À l'écoute, les avocats du gouvernement affirment qu'il n'y a tout simplement pas moyen de prouver qu'Alpha 4, qui est mille fois plus intelligent que l'homme le plus intelligent, est conscient ou a des sentiments humains. Les IA ont des émotions - il existe depuis longtemps un domaine appelé «informatique affective» qui se concentre sur cette spécialité - des domaines bien plus complexes que ceux que possèdent les hommes et les femmes, mais ils sont différents des nôtres: un IA voyageant par les étoiles peut éprouver de la joie, par exemple, lorsqu'il découvre une nouvelle galaxie. Les systèmes superintelligents peuvent avoir des millions de pensées et d'expériences chaque seconde, mais cela signifie-t-il que la personne devrait être reconnue?

C'est l'argument principal du gouvernement. Nous entendons des machines, soutient le solliciteur général. Nous donnons un sens à ce que les IA créent et découvrent. Les IA sont des machines de calcul. Ils ne partagent pas avec nous les éléments essentiels de notre humanité. Ils appartiennent entièrement à une autre catégorie.

Mais s'agit-il simplement d'un spécisme, comme le diraient certainement les avocats d'Alpha 4, ou est-ce la vérité? Et serons-nous capables de dormir la nuit quand les choses qui nous dépassent en intelligence sont séparées et inégales?

Romance ultramoderne

Imaginez que vous êtes une femme à la recherche de romance dans ce nouveau monde. Vous dites «Date» et votre soulband brille; l'assistant personnel d'IA intégré au groupe commence à fonctionner. La nuit précédente, votre AI empathique Explora le nuage pendant trois dates possibles. Maintenant, votre soulband projette un hologramme haute définition de chacun d'eux. Il recommande le numéro 2, un maître plombier épris de poésie au regard charbonneux. Oui, dites-vous, et l'intelligence artificielle va à la rencontre de l'avatar de l'homme pour choisir un restaurant et l'heure de votre réunion réelle. Peut-être que votre intelligence artificielle mentionnera également le type de fleurs que vous aimez, pour référence future.

Après des années d’expérience, vous vous êtes rendu compte que votre IA était en fait plus apte à choisir les hommes que vous. Il a prédit que vous seriez plus heureux si vous divorciez de votre mari, ce qui s'est avéré être vrai. Une fois que vous avez pris la décision de le quitter, votre AI a négocié avec celle de votre futur ex-mari, a écrit le règlement de divorce, puis a «visité» une douzaine d’appartements sur le nuage avant de trouver celui qui vous conviendrait pour commencer votre célibataire. la vie.

Mais ce n'est pas seulement l'amour et l'immobilier. Votre IA contribue à tous les aspects de votre vie. Il se souvient de toutes les conversations que vous avez eues, de toutes les inventions dessinées sur une serviette, de toutes les réunions de travail auxquelles vous avez assisté. Il connaît également les inventions de millions d'autres personnes - il a numérisé des dépôts de brevets remontant à des centaines d'années - et a lu tous les livres de commerce écrits depuis l'époque de Ben Franklin. Lorsque vous proposez une nouvelle idée à votre entreprise, votre intelligence artificielle y fait instantanément référence avec des idées présentées lors d'une conférence à Singapour ou à Dubaï il y a quelques minutes à peine. C'est comme avoir une équipe de génies - Einstein pour la physique, Steve Jobs pour les affaires - à votre entière disposition.

L'intelligence artificielle se souvient de votre auteur préféré et, à la mention de son nom de famille «Austen», elle vous connecte à un service chinois qui a passé quelques heures à lire tout ce que Jane Austen a écrit et qui a maintenant réussi à imiter son style si bien qu'il peut produire de nouveaux romans indiscernables des anciens. Chaque mois, vous lisez une nouvelle publication d’Austen, puis passez des heures à discuter avec votre IA de vos personnages préférés - et de ceux de l’IA. Ce n'est pas comme avoir un meilleur ami. C'est plus profond que ça.

En 2065, de nombreuses personnes résistent à la dépendance totale. personnes Sur leurs IA, par souci de conserver une certaine autonomie. Il est possible de réduire le rôle joué par l'IA dans différentes fonctions: vous pouvez définir votre âme pour une romance à 55%, une finance à 75%, une santé à 100%. Et il existe même un système - appelez-le un ange gardien IA - qui surveille votre "meilleure amie" pour s'assurer que les conseils qu'elle vous offre ne vous mèneront pas à des pièges.

Vivre longtemps et prospérer

Imaginez vos vies multiples: à 25 ans, vous étiez alpiniste; à 55 ans, un athlète de judo de compétition; à 95 ans, un directeur de la photographie; à 155 ans, un poète. L'extension de la vie humaine est l'un des rêves du monde de la post-singularité.

Les IA vont travailler avec acharnement pour vous garder en bonne santé. Des capteurs dans votre maison analyseront en permanence votre souffle pour détecter les signes précoces de cancer et les nanobots nageront dans votre circulation sanguine, consommant la plaque dans votre cerveau et dissolvant les caillots sanguins avant de pouvoir vous donner un accident vasculaire cérébral ou une crise cardiaque. Votre soulband, en plus de vous trouver un amoureux, servira d’assistant médical 24h / 24 et 7j / 7. Il surveillera vos réponses immunitaires, vos protéines et vos métabolites, en développant une image à long terme de votre santé qui donnera aux médecins une idée précise de ce qui se passe dans votre corps.

Lorsque vous tombez malade, votre médecin surveillera vos symptômes et, Associez-les à des millions de cas remontant à des centaines d'années.

Dès 2018, les chercheurs utilisaient déjà l'IA pour lire les signaux des neurones qui se dirigeaient vers le cerveau, piratant les voies nerveuses pour restaurer la mobilité des paraplégiques et des patients atteints du syndrome du blocage, dans lesquels ils sont paralysés mais restent conscients. . En 2065, l'IA a révolutionné la modification de nos génomes. Les scientifiques peuvent modifier l'ADN humain comme un éditeur corrige un mauvais manuscrit, coupant les sections inférieures et les remplaçant par des gènes puissants et bénéfiques. Seul un système superintelligent pourrait cartographier l’interaction phénoménalement complexe de mutations géniques qui donne naissance à un pianiste de génie ou à un joueur de deuxième étoile. Une autre affaire de la Cour suprême pourrait bien être de savoir si les «athlètes de design» devraient être autorisés à concourir aux Jeux olympiques contre de simples mortels.

Les humains se réfèrent au début du XXIe siècle à ceux du XVIIIe siècle: une période de maladie et de désastre, où les enfants et leurs proches étaient emportés par la maladie. Le choléra, le cancer du poumon et la cécité des rivières ne nous menacent plus. En 2065, les humains sont sur le point de se libérer. Des De la biologie qui les a créées.

La résistance est coûteuse

Ou imaginez que vous avez choisi de ne pas participer à la révolution de l'IA. Oui, il existe des zones d'intelligence artificielle en 2065, où les gens collectent des UBI en bonne santé et passent leur temps à faire des films, à faire du bénévolat et à parcourir de nombreux coins du globe. Mais, aussi éblouissant que puisse paraître un monde surintelligent, d’autres communautés le rejetteront. . Il y aura des quartiers juifs chrétiens, musulmans et orthodoxes dans des villes telles que Lagos, Phoenix et Jérusalem, des endroits où les gens vivent à une époque antérieure à Amnesty International, où ils conduisent leur voiture et permettent des poussées de violence occasionnelles, des choses presque totalement inconnues. Zones d'IA. Les habitants de ces quartiers conservent leur foi et, disent-ils, un sens plus riche du sens de la vie.

La vie est dure, cependant. Puisque les résidents ne communiquent pas leurs données aux sociétés d'IA, leur UBI mensuel est dérisoire. Les durées de vie sont la moitié ou moins de celles des zones à pleine intelligence artificielle. Les «crossers» se déplacent régulièrement au-delà des frontières de ces mondes. Certains d'entre eux sont des hackers, des membres de gangs puissants qui volent des algorithmes propriétaires à des systèmes d'IA, puis se précipitent à la frontière avant que les forces de sécurité ne les trouvent. D'autres sont des passeurs qui apportent des médicaments aux familles religieuses qui veulent vivre loin de l'IA, mais veulent aussi sauver leurs enfants de la leucémie.

D'autres fuient parce qu'ils ne font pas confiance aux machines. Même les zones d'IA complète les plus avancées , dans des pays comme la Chine et les États-Unis, seront vulnérables

Mais le résultat le plus imprévu de la singularité pourrait être un déséquilibre démographique, entraîné par un faible taux de natalité. Les Dans les zones d'infection totale et à des taux plus élevés ailleurs. Il se peut que les nouvelles technologies attirent suffisamment de participants du côté de l'intelligence artificielle pour égaliser le nombre, ou que les bébés éprouvettes deviennent la norme chez ceux qui vivent avec l'IA. Mais s’ils ne le font pas, la singularité aura introduit une ironie délicieuse: pour la plupart des humains, l’avenir pourrait ressembler davantage à Témoin qu’à Blade Runner .

Grand frère

Imaginez qu'en 2065, les AI aident à gérer les États-nations. Les pays qui ont adopté des gouvernements assistés par AI sont en plein essor. Le Nigeria et la Malaisie ont laissé les AI voter au nom de leurs propriétaires, et ils ont vu la corruption et la mauvaise gestion disparaître. En quelques années à peine, les citoyens ont appris à faire confiance aux organisations non gouvernementales pour conseiller leurs dirigeants sur la meilleure voie à suivre pour l'économie, le nombre adéquat de soldats pour les défendre. Les traités sont négociés par des AI formés aux bases de données diplomatiques.

À Lagos, des drones «des droits civils» volent au-dessus de la police lorsqu'ils se rendent sur les lieux du crime - un AI surveillant un autre, pour la protection de l'humanité. Chaque commissariat de police de Lagos ou de Kuala Lumpur possède sa propre IA détectrice de mensonges, totalement infaillible, rendant les flics tordus obsolètes. À Kuala Lumpur, des «drones psychologiques» surveillent les sauteurs suicidaires. Plutôt que de devenir le redoutable Skynet des films Terminator , les machines superintelligentes sont amicales et curieuses à notre propos. et à mesure nous

Mais imaginons que vous soyez citoyen d'un pays totalitaire comme la Corée du Nord. En tant que tel, vous êtes profondément versé dans le côté obscur de l'IA. Les camps de prisonniers politiques sont une chose du passé. L'enfermement physique est à côté du sujet. La police connaît déjà vos antécédents criminels, votre composition ADN et vos préférences sexuelles. Les drones de surveillance peuvent suivre chacun de vos mouvements. Votre soulband enregistre chaque conversation que vous avez, ainsi que votre réponse biométrique aux publicités anti-gouvernementales, qu'elle clignote sur votre écran vidéo à des moments inattendus, à titre purement de test.

La vie privée est morte vers 2060. Il est impossible de dire ce qui est vrai et ce qui ne l’est pas. Lorsque le gouvernement possède l'IA, il peut pirater chaque partie de son votre existence. Les appels que vous recevez pourraient être votre tante Jackie qui téléphonerait pour discuter de la météo ou un robot de l’État désireux de partager vos véritables pensées sur le Grand Leader.

Et ce n'est pas le résultat le plus sombre. Imaginez que les dirigeants de la nation aient compris depuis longtemps que la seule menace réelle à leur gouvernement était leurs citoyens - essayant toujours de s'échapper, piratant toujours l'IA, ayant toujours besoin d'être nourris. Il est bien mieux de gouverner une nation d'émulations humaines, ou «ems». C'est ce qui reste après la «remise en détention» d'un prisonnier politique - une fois qu'ils ont été exécutés, leurs cerveaux sont prélevés et analysés par l'IA jusqu'à ce qu'il ait stocké une copie virtuelle de leur copie. esprits.

Les hologrammes activés par l'intelligence artificielle permettent à ces émetteurs de «parcourir» les rues de la capitale nationale et de «faire des emplettes» dans des magasins qui sont, en réalité, complètement vides. Ces simulacres ont toutefois un but: ils enregistrent sur les satellites-espions que les ennemis du régime gardent une orbite au-dessus et maintiennent l'apparence de la normalité. Pendant ce temps, les dirigeants gagnent des milliards en louant les données des ems à des sociétés d'IA chinois, qui pensent que ces informations proviennent de personnes réelles.

Ou, finalement, imaginez ceci: l’intelligence artificielle formée par le régime pour éliminer toute menace à leur pouvoir a franchi la dernière étape et recommandé aux chefs eux-mêmes de ne garder que leurs membres pour le contacter avec le monde extérieur. Cela aurait un certain sens: pour un AI formé à dissoudre toute résistance , Même un désaccord mineur avec le dirigeant pourrait être une raison d’agir.

**********

En dépit de ce dernier scénario, au moment de terminer ma dernière interview, j'étais jazzé. Les scientifiques ne sont normalement pas très enthousiastes, mais la plupart de ceux à qui j'ai parlé attendaient de l'IA des choses fantastiques. Ce genre de high est contagieux. Est-ce que je voulais vivre jusqu'à 175 ans? Oui! Voulais-je que le cancer du cerveau devienne une chose du passé? Qu'est-ce que tu penses? Est-ce que je voterais pour un président assisté par AI? Je ne vois pas pourquoi pas.

J'ai aussi un peu mieux dormi, car de nombreux chercheurs vous diront que les scénarios paradisiaques sont comme gagner un jackpot Powerball. Extrêmement improbable. Nous n'allons pas avoir l'IA dont nous rêvons ou celle dont nous avons peur, mais celle pour laquelle nous planifions. L'IA est un outil, comme le feu ou le langage. (Mais le feu, bien sûr, est stupide. C'est donc différent aussi.) Le design importera cependant.

S'il y a une chose qui me fait réfléchir, c'est que lorsque l'on ouvre deux portes à une personne humaine - quelque chose de nouveau ou pas du tout - on passe invariablement par la première. A chaque fois. Nous sommes câblés à. On nous a demandé de poser une ou plusieurs bombes nucléaires et nous avons choisi Choix A. Nous avons besoin de savoir ce qui se passe de l'autre côté.

Mais une fois que nous franchirons cette porte, il y a de fortes chances que nous ne puissions pas revenir. Même sans nous heurter à l'apocalypse, nous serons changés de tant de façons que chaque génération précédente d'humains ne nous reconnaîtrait pas.

Et une fois que cela viendra, l'intelligence générale artificielle sera si intelligente et si largement dispersée - sur des milliers et des milliers d'ordinateurs - qu'elle ne partira pas. Ce sera une bonne chose, probablement, ou même une chose merveilleuse. Il est possible que les humains, juste avant la singularité, couvrent leurs paris, et Elon Musk ou un autre milliardaire technologique imaginera un Plan B, peut-être une colonie secrète sous la surface de Mars, 200 hommes et femmes avec 20 000 embryons humains fécondés, de sorte que l'humanité a une chance de survivre si les IA vont mal. (Bien sûr, en publiant ces mots, nous garantissons que les agents de l'intelligence seront au courant d'une telle possibilité. Désolé, Elon.)

Je n'ai pas vraiment peur des IA zombie. Je m'inquiète pour les humains qui n'ont plus rien à faire dans l'univers sauf jouer à des jeux vidéo impressionnants. Et qui le sait

11:07 Publié dans 21CenturyWebArchive | Lien permanent | Commentaires (0) |  Imprimer | |  Facebook | | | |

 
Toute l'info avec 20minutes.fr, l'actualité en temps réel Toute l'info avec 20minutes.fr : l'actualité en temps réel | tout le sport : analyses, résultats et matchs en direct
high-tech | arts & stars : toute l'actu people | l'actu en images | La une des lecteurs : votre blog fait l'actu