Clemmm Curiosity Cabinet

Depth Pro: Sharp Monocular Metric Depth in Less Than a Second

2 octobre 2024 09:16 huggingface

Le modèle Depth Pro, développé pour l'estimation de la profondeur monofocale, permet de générer des cartes de profondeur métriques à une résolution de 2.25 mégapixels en seulement 0.3 secondes, sans nécessiter de métadonnées telles que les intrinsèques de la caméra. Ce modèle se distingue par sa capacité à opérer à haute résolution en capturant des détails à haute fréquence, ce qui est essentiel pour des applications comme la synthèse de vues et l'édition d'images avancée. Les innovations techniques comprennent un transformateur de vision multi-échelle efficace et des métriques d'évaluation dédiées pour la précision des contours. Depth Pro a été comparé à d'autres modèles existants, montrant des performances supérieures en termes de précision des contours tout en fonctionnant beaucoup plus rapidement. Des expériences étendues et diverses configurations d'architectures pré-entraînées ont été testées pour optimiser la précision et la rapidité du modèle, fournissant des résultats nettement supérieurs pour des applications en temps réel. link

How AI Could Transform the World for the Better

1 octobre 2024 15:50 darioamodei

Le texte discute du potentiel futur de l'intelligence artificielle (IA) à transformer la société de manière positive en touchant à des sphères aussi diversifiées que la biologie, la santé physique et mentale, le développement économique, la paix et la gouvernance. L'auteur, dirigeant de l'entreprise Anthropic, met en lumière les implications possibles d'une IA puissante activée dans le respect des valeurs démocratiques et humanistes. Selon lui, l'IA pourrait non seulement accélérer la recherche scientifique et médicale, traiter efficacement des maladies, mais aussi combattre pauvreté et inégalité à un niveau mondial. Face aux dangers potentiels, il plaide pour une approche prudente et régulée de l'IA, ciblant principalement la réduction des risques tout en exploitant ses vastes bénéfices possibles. L'implémentation réussie de l'IA promet une amélioration rapide des conditions de vie humaines, une démocratisation plus forte, et une collaboration internationale renforcée. Cependant, la réalisation de cette vision nécessiterait une coopération mondiale intensive et un engagement éthique fort pour assurer une distribution équitable des ressources et des technologies générées par l'IA. link

Hidden traces of humanity: what AI images reveal about our world

1 octobre 2024 15:38 theguardian

Les progrès de l'IA générative ont permis de créer des images à partir de textes en quelques secondes seulement, changeant la donne dans le domaine artistique. Des outils comme Dall-E 3 et Stable Diffusion utilisent des réseaux neuronaux pour interpréter et traduire les prompts textuels en visuels complexes, adoptant des styles artistiques variés selon les instructions fournies. Cette capacité à générer des images précises et stylistiquement diverses a ouvert de nouvelles perspectives pour la créativité numérique, tout en soulevant des questions sur l'originalité et l'autonomie artistique. Les débats se concentrent notamment sur l'impact de ces technologies sur le travail des artistes et illustrateurs, avec certains plaidant pour une réglementation qui valorise la création humaine face à l'efficacité algorithmique. Parallèlement, ces outils révèlent comment les préjugés et les pratiques de catégorisation visuelle peuvent perpétuer des stéréotypes, ce qui nécessite une réflexion critique sur les données utilisées pour entraîner les IA. Ainsi, alors que l'IA générative continue de se développer, elle met en lumière les interactions complexes entre la technologie, la création artistique et les perceptions humaines. link

Whisper Turbo: Enhanced Speed, ​ Lower VRAM, Open-Source​

1 octobre 2024 09:28 huggingface

Le modèle Whisper large-v3-turbo d'OpenAI, marquant un développement notable dans la technologie de reconnaissance automatique de la parole (ASR), a été rendu public sous licence apache 2.0. Il atteint des vitesses de traitement jusqu'à huit fois supérieures à celles de ses versions antérieures, tout en réduisant considérablement la charge VRAM requise à seulement 6 Go. Cela est réalisé grâce à la diminution drastique du nombre de couches de décodage de 32 à 4, bien que cela entraîne une légère baisse de qualité. Formé sur plus de 5 millions d'heures de données étiquetées et affiné durant deux époques supplémentaires sans données de traduction, il démontre une précision robuste dans la plupart des langues et excelle notamment sur le dataset FLEURS. Cependant, il montre une certaine dégradation sur des langues plus complexes comme le thaï et le cantonais. Inspiré par les principes de Distil-Whisper, ce modèle place un accent sur l'amélioration de l'efficience sans compromettre outre mesure l'efficacité, inaugurant une ère de technologie ASR plus accessible et pratiquement réalisable pour les applications en temps réel, un progrès important pour OpenAI et la communauté IA globale. link

Snapchat’s new Footsteps feature tracks your location history

30 septembre 2024 18:40 techcrunch

Snapchat a récemment introduit 'Footsteps', une fonctionnalité initialement réservée aux abonnés de Snapchat+ et désormais disponible pour tous les utilisateurs iOS. Cette fonction utilise Snap Map pour montrer les lieux visités par l’utilisateur et le pourcentage du monde qu’il a exploré. À la première utilisation, 'Footsteps' calculera les déplacements à partir des Snaps déjà sauvegardés dans les souvenirs de l'utilisateur. Cependant, pour des mises à jour ultérieures, cela se basera exclusivement sur les données de localisation, à moins que l'utilisateur n'active le mode 'Ghost', qui cache leur localisation aux amis. Snapchat prévoit d'étendre cette fonctionnalité aux utilisateurs Android prochainement. La particularité de 'Footsteps' est de fournir des statistiques visuelles telles que le pourcentage d’une ville ou d’un pays exploré, basées sur les endroits visités et les Snaps enregistrés. Les utilisateurs peuvent personnaliser la visibilité de leurs 'Footsteps', les désactiver ou effacer l’historique à travers les paramètres du profil. Ce développement permet à Snapchat de se différencier de concurrents comme Instagram et TikTok, qui ne proposent pas encore de fonctionnalités similaires, bien qu'Instagram développe une fonctionnalité comparable appelée 'Friends Map'. link

Lapsi is rebooting the stethoscope as a health tracking data platform

30 septembre 2024 18:39 techcrunch

Lapsi Health initie une révolution dans le domaine médicotechnique en obtenant l'approbation de la FDA pour le Keikku, un stéthoscope numérique qui s'intègre dans une stratégie plus large de suivi de santé par le biais de la technologie. Le dispositif, présenté comme une plateforme de capture de données acoustiques et autres, permet l'enregistrement de sons, la transmission sécurisée de données et pourrait être amélioré logiciellement pour inclure des analyses AI, notamment pour la détection de murmures cardiaques. À terme, Lapsi envisage de lancer Ilo pour les femmes enceintes, utilisant des fonctionnalités similaires pour surveiller le fœtus. Le Keikku sera vendu directement aux professionnels de la santé aux États-Unis à un prix qui le place en concurrence avec d'autres stéthoscopes numériques, bien que Lapsi soit une entreprise moins financée que ses concurrents comme Eko Health. La suite de dispositifs de Lapsi comprendra une génération deux de Keikku avec des capteurs enrichis prévue pour fin 2025, alignant Lapsi avec les ambitions de diagnostics améliorés et de gestion médicale à distance. link

AI chipmaker Cerebras files for IPO to take on Nvidia

30 septembre 2024 18:35 nbcnewyork

Cerebras Systems, une startup spécialisée dans les puces d'intelligence artificielle, a récemment déposé son prospectus pour une offre publique initiale (IPO), envisageant de se lancer sur le Nasdaq sous le symbole 'CBRS'. Fondée en 2016 et basée à Sunnyvale, Californie, Cerebras est dirigée par Andrew Feldman, qui a auparavant vendu sa startup SeaMicro à AMD. Malgré une montée des revenus, l'entreprise a enregistré une perte nette de 66.6 millions de dollars durant les premiers six mois de 2024, signalant une amélioration par rapport à l'année précédente (77.8 millions de dollars de perte pour 8.7 millions en ventes). Cerebras se positionne comme un concurrent direct de Nvidia, en mettant en avant son chip WSE-3 avec plus de cœurs et de mémoire que le H100 de Nvidia. Cerebras compte aussi des géants comme AMD, Intel, Microsoft et Google comme concurrents. Ils offrent également des services basés sur le cloud qui utilisent leurs propres clusters informatiques. Cette IPO survient dans un contexte où le marché des IPOs technologiques est rare en raison de taux d'intérêt élevés poussant les investisseurs vers des actifs rentables, malgré un récent gain d'intérêt après la réduction des taux par la Fed. link

Intel Launches Next-Generation AI Applications

30 septembre 2024 18:31 aibusiness

Intel a fait une annonce récente sur une collaboration avec IBM qui implique le déploiement des accélérateurs IA Gaudi 3 comme service sur le cloud IBM, afin de renforcer les capacités de l'IA tout en réduisant les coûts. Les nouveaux systèmes IA d'entreprise d'Intel, notamment les processeurs Xeon 6 avec des cœurs de performance (P-cores) et les accélérateurs Gaudi 3, sont conçus pour des performances optimales par watt et un coût de propriété réduit. Les Gaudi 3 sont spécialement optimisés pour l'IA générative à grande échelle avec une mémoire considérable et des capacités de réseau évolutives, tandis que les Xeon 6 offrent le double de la performance de la génération précédente. Ces produits sont une réponse à l'augmentation de la concurrence dans le domaine de l'IA face à des rivaux tels que Nvidia, AMD, et Qualcomm. Intel cherche non seulement à se démarquer en termes de performance et d'efficacité, mais aussi en matière de sécurité et d'écosystème ouvert, selon Justin Hotard et Michelle Johnston Holthaus, des dirigeants chez Intel. link

Asus ProArt PZ13 Review: A Cheaper Surface Pro

30 septembre 2024 14:04 Feed: All Latest

Le dernier modèle ProArt PZ13 présenté par Asus est une version plus accessible mais moins performante des ordinateurs portables détachables type Surface Pro de Microsoft. Vendu à 1 100 dollars, il offre un écran tactile de 13 pouces, 16 Go de RAM et un clavier magnétique inclus. Cependant, le ProArt embarque un processeur Qualcomm moins puissant et affiche une résolution légèrement inférieure à celle du Surface Pro. Il se distingue néanmoins par un disque SSD de 1 To et une meilleure connectivité, bien que certains ports soient moins accessibles. Le poids total de 3,3 livres avec le clavier et le support rend l'appareil plus lourd comparé au modèle de Microsoft. Les performances du ProArt sont également inférieures, surtout dans les tests graphiques et d'IA, où il peine à tenir la comparaison. Malgré ces points faibles, la durée de vie de la batterie du ProArt est remarquable, atteignant presque 20 heures en lecture vidéo. Enfin, bien que le ProArt présente certains inconvénients comme son poids et sa performance réduite, son prix inférieur pourrait le rendre attrayant pour ceux qui cherchent à acquérir un PC 2-en-1 à clavier détachable sans trop dépenser. link

The metaverse never happened, but Mark Zuckerberg’s got some funky glasses

29 septembre 2024 11:11 Fast Company

La vision du métaverse de Meta, autrefois au cœur de la transformation de Facebook, ne s'est pas concrétisée, remplacée par de nouvelles ambitions telles qu'une paire de lunettes de réalité augmentée, présentée comme un prototype chez Meta. Ces lunettes, baptisées 'Orion', visent à projeter des hologrammes dans le champ visuel de l'utilisateur. Malgré cet échec du métaverse, Meta a su rebondir en se concentrant sur l'intelligence artificielle, notamment avec leur AI 'Llama', qui est très en vogue. Par ailleurs, le marché financier reste optimiste concernant Meta, voyant son potentiel d'innovation en IA. D'autre part, Reddit, la plateforme de médias sociaux, se diversifie en se localisant dans diverses langues, ce qui a boosté son usage en dehors des États-Unis. Enfin, le domaine des robo-taxis, malgré les défis persistants liés à la technologie de conduite autonome, continue de progresser, avec Tesla et Waymo en tête de file dans les développements et déploiements de ces technologies. link

An ‘iPhone of AI’ Makes No Sense. What Is Jony Ive Really Building?

28 septembre 2024 12:00 Feed: All Latest

LoveFrom, dirigé par Jony Ive, ancien chef du design chez Apple, travaille en association avec OpenAI pour développer un nouveau dispositif IA. Ce projet, encore non nommé et très secret, inclut des contributeurs de renom tels que l'Emerson Collective de Laurene Powell Jobs. Leur objectif est de créer une expérience utilisateur qui soit moins perturbatrice socialement que l'iPhone, tout en accédant à des technologies comme ChatGPT et Dall-E. L'approche envisagée cherche à minimiser la dépendance aux écrans, suggérant un changement radical dans l'interaction avec les dispositifs technologiques. La conception pourrait inclure des éléments modulaires et durables, reprenant des principes déjà observés dans d'autres projets de LoveFrom, tels que des intérieurs numériques pour Ferrari ou des collaborations de mode haut de gamme. Ce nouveau dispositif IA pourrait également impliquer un mode d'interaction moins invasif, sans requête constante de l'attention de l'utilisateur, offrant une intégration plus naturelle dans le quotidien. Les implications de ce développement sont significatives, étant donné le passé de Ive avec Apple et son impact sur la technologie moderne de consommation. Ce projet pourrait potentiellement redéfinir notre relation avec les dispositifs intelligents en favorisant une interaction plus respectueuse et intégrée. link

Meta’s Race for Your Face + Google’s Hit A.I. Notebook + HatGPT

27 septembre 2024 11:00 Hard Fork

Kevin Bruce, chroniqueur pour le New York Times et présentateur de 'Hard Fork', discute d'un événement inattendu dans sa vie professionnelle. Il révèle que, suite à une blague faite il y a deux ans lors d'un tournage pour un documentaire sur l'intelligence artificielle avec Bill Gates, il a été transformé en une version plus attirante de lui-même grâce à l'IA. Cela s'est traduit par son apparition sous l'étiquette 'hot Kevin Bruce' sur Netflix, ce qui a choqué ses amis et sa famille. Cette expérience soulève des questions sur l'influence de la technologie dans la représentation des individus dans les médias et les conséquences non anticipées sur la vie personnelle. L'histoire est agrémentée d'une anecdote parallèle sur un membre d'un groupe d'amis surnommé 'Hot Casey' pour ses traits attirants, offrant une réflexion sur la perception et les impacts sociaux de l'attrait physique. L'épisode examine également la visite de Casey Noon à Menlo Park pour découvrir les nouvelles sorties de Meta, ainsi que un débat sur le discours et les implications de produits innovants révélés par Mark Zuckerberg lors de cet événement. L'ironie de l'évolution technologique est explorée en profondeur, posant des questions sur le rôle futur de la technologie dans notre quotidien et dans nos interactions sociales. link

Meta Connect 2024: Orion glasses, Quest 3S headset, Meta AI upgrades, Ray-Ban Meta real-time video, and more

26 septembre 2024 18:36 techcrunch

Meta Connect 2024, un événement orienté développeurs dirigé par Mark Zuckerberg, a introduit des technologies significatives axées sur l'IA et le métavers. Parmi les principales annonces, les lunettes Orion AR de Meta se distinguent comme un prototype d'avant-garde pour la réalité augmentée avec hand-tracking, eye-tracking et une interface neuronale, bien que leur commercialisation ne soit pas imminente. Par ailleurs, le casque Quest 3S a été révélé comme une version plus abordable du Quest 3, avec un lancement prévu pour le 15 octobre à partir de $299. Ce nouveau casque supporte les applications Quest existantes et se concentre sur des fonctionnalités de réalité mixte. En outre, Meta AI a fait des progrès notables, notamment avec le déploiement d'un assistant vocal intégré à Messenger et d'autres plateformes, capable de fournir des réponses vocales simulées, et la mise à jour de son modèle Llama en version 3.2, qui permet maintenant d'interagir avec divers formats multimédias. La collaboration avec Ray-Ban a également été renforcée, leurs lunettes intelligentes intégrant désormais le traitement vidéo en temps réel et des fonctionnalités de traduction en direct. Ces avancements soulignent l'engagement continu de Meta dans l'amélioration de l'interaction entre les utilisateurs et le digital, notamment à travers des applications plus immersives et intégrées. link

Meta releases its first open AI model that can process images

23 septembre 2024 18:41 theverge

Meta a récemment introduit Llama 3.2, un modèle d'IA ouvert qui marque une avancée significative en étant capable de traiter simultanément des images et du texte. Cette capacité multimodale positionne Meta pour concurrencer avec des entités telles que Google et OpenAI qui ont lancé des modèles similaires l'année précédente. Llama 3.2 est conçu pour faciliter le développement d'applications de réalité augmentée, de moteurs de recherche visuels et d'analyse de documents textuels. Avec des modèles allant de 1 milliard à 90 milliards de paramètres, il est optimisé pour fonctionner sur diverses plateformes hardware, y compris les mobiles. Selon Ahmad Al-Dahle, vice-président de l'IA générative chez Meta, l'implémentation pour les développeurs sera aisée, promouvant une intégration rapide dans les applications existantes. En outre, le modèle précédent, Llama 3.1, reste pertinent avec ses 405 milliards de paramètres, offrant des capacités supérieures en génération de texte. Cette initiative de Meta non seulement élargit les horizons de l'utilisation pratique de l'IA mais renforce également la pertinence de ses innovations hardware telles que les lunettes Ray-Ban Meta. link

Meet MathPrompt, a way threat actors can break AI safety controls

23 septembre 2024 18:38 csoonline

MathPrompt est une nouvelle méthode qui permet de contourner les mécanismes de sécurité des IA génératives en transformant des requêtes malicieuses en équations mathématiques. Les chercheurs ont démontré que cette approche pouvait bypasser les fonctionnalités de sécurité dans plusieurs plateformes IA de pointe, avec un taux de succès moyen de 73,6% sur 13 modèles testés. Joseph Steinberg, un expert en IA et cybersécurité, compare cela à des URL malformées utilisées précédemment pour exploiter des systèmes de sécurité web, mais reste optimiste sur la capacité à sécuriser les LLM contre de telles attaques. Les chercheurs insistent sur l'importance d'une approche globale de la sécurité de l'IA, notamment en développant des mécanismes de sécurité robustes pour tous les types d'entrées potentielles. La capacité des LLM à comprendre et manipuler des mathématiques complexes représente à la fois un avantage et une vulnérabilité. Les CISOs sont encouragés à maintenir des politiques de cybersécurité rigoureuses indépendamment des menaces spécifiques et à priver les IA publiques de données sensibles. link

France appoints first AI minister amid political unrest as it aims to become global AI leader

23 septembre 2024 18:36 euronews

La France a nommé Clara Chappaz, ex-directrice de La French Tech, comme première ministre de l'Intelligence Artificielle (IA), marquant un tournant politique majeur. Ce nouveau rôle souligne l'ambition nationale de devenir une référence mondiale en matière d'IA sous la présidence d'Emmanuel Macron, souhaitant transformer Paris en « ville de l'IA ». Outre sa responsabilité dans l'avancement de l'IA, Chappaz s'est engagée contre la discrimination avec la création d'un pacte de parité signé par plus de 700 startups. Elle a également un passé notable dans le commerce de luxe et d'articles de seconde main, montrant une carrière diversifiée qui lui donne une vision unique pour ce poste. Alors que la France s'apprête à accueillir le prochain Sommet International de l'IA en février, cette nomination coïncide avec l'investissement de 500 millions d’euros dans des clusters d'IA prévus d'ici 2030, affirmant son rôle de leader potentiel dans le domaine technologique global. link

Le Brésil, jeune laboratoire d’une vie sans le réseau social X

23 septembre 2024 18:29 Pixels : Toute l’actualité sur Le Monde.fr.

Le réseau social X, propriété d'Elon Musk, a été suspendu au Brésil suite à une décision du Tribunal suprême fédéral le 30 août, conséquence du refus de l'entreprise de bloquer des comptes accusés de compromettre la démocratie. Cette situation a créé un environnement unique pour les Brésiliens, transformant le pays en un laboratoire d’une vie sans ce réseau dominant. Les utilisateurs, notamment les 22 millions sur X, ont dû s'adapter rapidement. L'influenceuse Babi Magalhães et la journaliste Patricia Campos Mello, entre autres, ont témoigné des défis rencontrés, comme l'incapacité de migrer efficacement leurs audiences vers d'autres plateformes. En outre, cette suspension intervient dans un contexte de campagne municipale, mais selon la candidate socialiste Carol Vergolino, la vie continue sans X, voire mieux pour ceux qui préfèrent un contact direct avec les électeurs. Malgré une tentative éphémère de contournement de la suspension, le réseau social semble désormais prêt à collaborer avec la justice pour une potentielle réouverture. Cependant, cet épisode démontre, selon le chercheur Joao Victor Archegas, la résilience de l’internet et la capacité d'adaptation du public, soulignant l'impermanence potentielle des plateformes numériques. link

[Édito] L’intelligence artificielle est-elle intelligente ou artificielle ?

23 septembre 2024 17:55 Next - Flux Complet

L'article aborde la question complexe de la définition de l'intelligence artificielle (IA), soulignant l'absence de consensus et les différentes interprétations proposées par des sources telles que le Larousse, Wikipédia, le Robert, et la CNIL. Le terme 'intelligence artificielle' englobe diverses techniques visant à simuler des aspects de l'intelligence humaine, mais la CNIL propose une définition élargie incluant des algorithmes qui évoluent au fil du temps. Le texte met en évidence les nuances entre un simple algorithme et une véritable IA, particulièrement dans leur capacité d'apprendre et d'évoluer. Un focus est mis sur le marketing derrière l'utilisation du terme IA, critiqué pour embellir le potentiel réel de ces technologies. La discussion touche également à l'impact sociétal de l'IA, en particulier la manière dont elle peut reproduire les biais présents dans les données humaines. Finalement, l'auteur souligne l'importance de bien choisir les termes pour communiquer efficacement sur un sujet aussi complexe, malgré la tendance marketing à simplifier ou à exagérer les fonctionnalités des technologies pour les rendre plus accessibles au grand public. link

macOS Sequoia review: iPhone mirroring is more useful than you think

23 septembre 2024 16:00 Engadget is a web magazine with obsessive daily coverage of everything new in gadgets and consumer electronics

macOS Sequoia se distingue par des fonctionnalités innovantes qui revitalisent l'expérience utilisateur, notamment le mirroring iPhone qui facilite la gestion des notifications et l'accès aux applications mobiles directement sur un Mac. Cette fonctionnalité est compatible avec les Mac dotés de puces Apple Silicon ou des derniers modèles Intel avec la puce de sécurité T2, en interaction avec un iPhone sous iOS 18. Les notifications du téléphone sont synchronisées avec le centre de notifications du Mac, ce qui réduit les distractions et améliore l'efficacité du flux de travail. Le mirroring n'affecte pas les performances, avec des jeux et vidéos fonctionnant à 60fps. macOS Sequoia apporte également un meilleur placement des fenêtres, similaire aux caractéristiques de Windows, et des améliorations dans les videoconférences avec des remplacements d'arrière-plan plus précis grâce à la technologie d'apprentissage automatique d'Apple. D’autres améliorations incluent une nouvelle application Mots de passe, des notes vocalisées avec transcription automatique, et la possibilité de programmer l'envoi de messages enrichis. Ces avancées font de macOS Sequoia une mise à jour majeure et utile, renforçant l'intégration entre les plateformes macOS et iOS. link

Hugging Face lets you try what’s next in AI

23 septembre 2024 04:11 Fast Company

Hugging Face est un terrain de jeu numérique où les utilisateurs peuvent expérimenter gratuitement les dernières avancées en matière d'intelligence artificielle. Cette plateforme fonctionne comme une communauté open-source, permettant aux développeurs de tester et de partager de nouveaux modèles d'IA. Les utilisateurs peuvent générer des images étonnantes, améliorer la qualité des images floues, créer des gifs personnalisés, générer des légendes détaillées pour les images, et même animer des portraits à partir de vidéos. Hugging Face offre aussi des outils pour traduire des vidéos en plusieurs langues et pour explorer les biais de l'IA dans les modèles de génération d'images en fonction du genre, de la tonalité de la peau et de l'âge des sujets générés. Cette plateforme propose également une application mobile flexible pour interagir avec divers bots, de storytellers à philosophes, et pour générer des images ou des requêtes de type ChatGPT sans coût. Malgré la technicité de certains noms d'application, l’interface utilisateur est généralement accessible, bien que principalement destinée à ceux possédant des connaissances techniques en apprentissage automatique et en traitement du langage naturel. link