Clemmm Curiosity Cabinet
L'approche d'OpenAI envers la rétrométhodologie externe pour les modèles et systèmes d'intelligence artificielle
4 décembre 2024 14:50
openai
OpenAI a adopté la pratique du red teaming externe pour optimiser la sécurité des modèles et systèmes d'IA. Le red teaming, ou l'utilisation d'équipes adverses indépendantes, permet à OpenAI de découvrir de nouveaux risques éventuels et de tester l'efficacité des mesures d'atténuation déjà en place. Cette méthode enrichit également les métriques de sécurité existantes et aide à forger de nouveaux critères de sécurité. Les équipes rouges externes, composées d'experts de divers domaines, évaluent les modèles IA en simulant des scénarios d'utilisation réels et en identifiant les failles potentielles, contribuant ainsi à une amélioration constante des systèmes. Le processus repose sur plusieurs étapes clefs, notamment la sélection de la composition des équipes rouges, la détermination des niveaux d'accès aux modèles, et la formation nécessaire pour mener à bien ces évaluations. Les résultats obtenus guident non seulement les phases ultérieures de développement des modèles mais aussi leur déploiement, assurant une meilleure adaptation aux besoins réels et un niveau de sécurité accru. OpenAI divulgue ces résultats via des publications comme les 'System Cards' pour chaque modèle, soulignant les avantages de cette pratique dans la gestion des risques et l'augmentation de la confiance envers les technologies d'IA.
link
Entreprise européenne de l'infrastructure IA Nebius récolte 700 millions de dollars de Nvidia, d'Accel et d'autres à une évaluation de 2,5 milliards de dollars
2 décembre 2024 14:26
techcrunch
Nebius, entreprise européenne d'infrastructure pour l'intelligence artificielle et anciennement connue sous le nom de Yandex N.V., a réussi à lever 700 millions de dollars pour financer son expansion sur le marché américain. Cette levée de fonds s'est faite grâce à l'appui de plusieurs investisseurs renommés, dont Nvidia, Accel et Orbis. On note que Nebius avait déjà 2,2 milliards de dollars en réserve après avoir vendu ses actifs russes, et vise à present étendre son réseau de centres de données, notamment par l'ajout d'un nouveau cluster GPU à Kansas City et le triplement de la capacité de son centre de données phare en Finlande. Matt Weigand d'Accel rejoindra le conseil d'administration de Nebius. La société envisage déjà de nouvelles levées de fonds pour soutenir ses ambitions de croissance rapide et prévoit d'atteindre un taux de croissance annuel entre 750 millions et 1 milliard de dollars d'ici fin 2025.
link
Comment la Corée du Nord a infiltré des dizaines d'entreprises américaines
1 décembre 2024 06:00
Underscore_
Dans une récente révélation, il a été exposé qu'une unité spécialisée nord-coréenne, connue sous le nom de bureau 121, a infiltré de manière frauduleuse le marché du travail américain en se faisant passer pour des informaticiens qualifiés. Ces faux employés, souvent basés en Chine pour des raisons d'infrastructure et de sécurité, ont manipulé le système de télétravail pour obtenir de lucratifs postes à distance au sein d'entreprises tech, où ils avaient pour mission de déployer des malwares, de collecter des fonds pour le régime nord-coréen, et réaliser de l'espionnage industriel. Ce vaste stratagème a profité de la vague du télétravail post-COVID-19 et a mis en lumière les importantes failles dans les processus de recrutement des entreprises américaines, qui ont fait l'objet d'une pénétration massive par des acteurs malveillants. Les autorités américaines, alertées par des anomalies dans les systèmes de sécurité IT des entreprises, aidées par des indices comme des communications suspectes ou anomalies lors des engagements des employés, ont pu remonter jusqu'à ces opérations d'espionnage. Des mesures sévères ont été prises pour contrer ces menaces, incluant des initiatives FBI ciblant le démantèlement des réseaux de ces soi-disant fermes d'ordinateurs portables, tout en proposant des récompenses substantielles pour toute information pouvant conduire à une arrestation.
link
SAMOURAIS : Adaptation du modèle de segmentation Anything pour la segmentation multilingue d'images
30 novembre 2024 14:46
github
SAMURAI est une évolution spécifique du modèle SAM 2 dédiée au suivi visuel des objets, intégrant une analyse du mouvement et une sélection de mémoire optimisée pour améliorer la précision et la robustesse du suivi, notamment dans des scènes encombrées et des situations d'occlusions. En utilisant des informations de mouvement et en sélectionnant intelligemment les caractéristiques de mémoire pertinentes d'une image à l'autre, SAMURAI minimise la propagation d'erreurs et optimise la performance de suivi. Contrairement aux modèles traditionnels qui nécessitent des réglages fins, SAMURAI maintient une performance de haut niveau en Zero-Shot, ce qui démontre sa capacité à généraliser efficacement sans entraînement supplémentaire. Les tests sur divers benchmarks, tels que LaSOT, LaSOText et GOT-10k, prouvent que SAMURAI peut surpasser les méthodes supervisées et offre une solution viable et performante pour le suivi d'objets en temps réel dans des conditions variées.
link
Learn how to use Apple Intelligence’s ‘Image Playground’
29 novembre 2024 14:58
techcrunch
'Image Playground' est une nouvelle fonctionnalité d'Apple Intelligence qui sera incluse dans la prochaine mise à jour iOS 18.2. Elle permet aux utilisateurs de générer des images de style cartoon à partir de descriptions textuelles en utilisant une application dédiée ou l'application Messages. Pour l'utiliser, il suffit d'entrer une description de l'image désirée dans la zone de texte de l'application, et l'IA d'Apple créera l'image. Si les résultats initiaux ne sont pas satisfaisants, ils peuvent être affinés en fournissant des descriptions plus détaillées ou en sélectionnant parmi les recommandations d'Apple. En plus de générer des images à partir de textes, les utilisateurs peuvent également télécharger des photos pour obtenir des versions modifiées par l'IA, en ajoutant des éléments comme des chapeaux de fête ou des arrière-plans différents et en changeant le style artistique. 'Image Playground' sera accessible à tout participant au programme bêta logiciel d’Apple et son lancement officiel est prévu pour décembre.
link
Les 100 technologies les plus iconiques du Hard Fork : Guide complet des innovations blockchain
29 novembre 2024 13:00
Hard Fork
L'épisode spécial de Thanksgiving du podcast Hard Fork, animé par Kevin Roos et Casey Newton, se concentre sur deux thèmes principaux : la préparation de la dinde de Thanksgiving et un compte à rebours des 100 technologies les plus marquantes. Kevin partage son enthousiasme pour la cuisson avancée de la dinde, notamment le saumurage, tandis que Casey discute des risques et plaisirs liés à la cuisson de la dinde frite. Plus loin dans l'épisode, ils lancent un débat ludique mais informatif sur les technologies qui ont profondément influencé la société moderne. De l'électricité à l'iPhone, en passant par l'imprimerie et les vaccins, ils abordent l'histoire et l'impact de chaque technologie, soulignant comment celles-ci ont modelé les interactions humaines, l'économie, et d'autres aspects cruciaux de la vie quotidienne. Cet échange non seulement divertit mais vise aussi à sensibiliser sur l'importance de la technologie dans l'évolution humaine.
link
États-Unis : une influenceuse porte plainte pour appropriation illicite de son style de vie
28 novembre 2024 15:32
Next - Flux Complet
Le texte discute d'un conflit juridique entre deux influenceuses, Alyssa Sheil accusée par Sydney Nicole Gifford pour violation de droits d'auteur et autres infractions liées à leur travail sur des réseaux comme TikTok et Instagram. Les deux femmes suivent la tendance 'clean girl', qui implique une esthétique soignée et la promotion de produits sur Amazon. Gifford accuse Sheil de copier ses mises en scène de produits et ses styles. Cette issue pourrait forcer le système judiciaire à mieux définir les règles autour de la propriété intellectuelle dans le monde d’influence numérique. La question de l'influence des algorithmes sur la création de contenu similaire par différents utilisateurs est également abordée, posant des questions sur la distinction entre inspiration et plagiat direct. En parallèle, la réglementation actuelle autour des droits des influenceurs est vue comme insuffisante pour protéger pleinement leur contenu unique. La décision de ce procès pourrait avoir un impact significatif sur la manière dont les créateurs de contenu protègent leurs œuvres numériques contre le plagiat et la copie indue.
link
☕️ Selon une étude, près de 10 % des ingénieurs logiciels « ne font pratiquement rien »
27 novembre 2024 15:30
Next - Flux Complet
Yegor Denisov-Blanch, qui a débuté par une carrière autodidacte en programmation, a mené une étude controversée sur la productivité des ingénieurs logiciels à Stanford. Utilisant des données de plus de 50,000 ingénieurs, sa recherche propose que près de 9,5 % d'entre eux sont très peu actifs, ce qu'il désigne sous le terme 'ingénieurs fantômes'. L'étude révèle également des variations de productivité selon le mode de travail, avec 14 % des télétravailleurs jugés peu productifs. Bien conscient des limites de ses méthodes, Denisov-Blanch a employé une approche basée sur l'analyse de dépôts Git et les évaluations simulées par des experts. Ses conclusions suggèrent des pertes économiques importantes pour les grandes entreprises technologiques telles qu'IBM, Microsoft, et Google, évaluant à des milliards les pertes dues à ces ingénieurs fantômes. La réponse du chercheur aux critiques sur la validité de son étude pointe vers des recherches supplémentaires visant à affiner leurs méthodologies. Il encourage les grandes entreprises à collaborer à ses enquêtes pour mieux identifier et gérer les performances des ingénieurs, afin de réduire potentiellement les coûts opérationnels substantiels associés à la non-productivité.
link
OpenAI suspend l'accès au outil de génération vidéo Sora après les protestations des artistes concernant les préoccupations sur le droit d'auteur
27 novembre 2024 14:30
Engadget is a web magazine with obsessive daily coverage of everything new in gadgets and consumer electronics
OpenAI a récemment suspendu l'accès à Sora, son outil de génération de vidéo par intelligence artificielle, après que des artistes ont protesté contre leur utilisation en tant que 'marionnettes PR'. Les artistes, ayant accès librement à Sora pour le tester, se sont rebellés en divulguant l'accès au public, insatisfait du contrôle excessif d'OpenAI sur les contenus créés et leur rôle réduit à de simples testeurs non rémunérés. OpenAI a réagi en fermant l'accès à Sora après seulement trois heures, en déclarant que la participation au programme était volontaire. La controverse a soulevé des questions sur la provenance des données d'entraînement de Sora, notamment en mars lorsque le CTO d'OpenAI a admis ne pas être certain de l'utilisation des données provenant de YouTube ou d'autres plateformes, malgré les mises en garde du PDG de YouTube contre l'utilisation de ses vidéos pour l'entraînement de modèles d'IA. Malgré la protestation, un autre artiste du programme a exprimé que ces opinions ne reflètent pas celles de la majorité des participants.
link
Les meilleurs cadeaux pour photographes et vidéastes en 2023
27 novembre 2024 14:00
Engadget is a web magazine with obsessive daily coverage of everything new in gadgets and consumer electronics
Trouver le cadeau idéal pour les passionnés de photographie et de vidéographie peut être délicat, mais notre guide offre une variété d'options à tous les prix. Pour les débutants, le Canon EOS R100 à moins de $600 est parfait avec sa haute qualité d'image et de vidéo. Pour ceux qui veulent capturer des instantanés uniques, le Fujifilm Instax Square SQ40 et ses impressions physiques offrent une expérience tangible et immédiate. Les vidéastes amateurs de sensations fortes apprécieront le GoPro HERO13 Black avec sa stabilité et qualité vidéo exceptionnelles. Pour les vlogueurs, le Sony ZV-1F et le DJI Mic 2 sont idéaux pour améliorer la qualité audio et vidéo. Les accessoires comme le GorillaPod 3K ou le Joby Gorillapod 3K Stand permettent de positionner facilement les caméras pour des prises de vue optimales. En termes de stockage, le choix des cartes mémoire est crucial et des options comme la Lexar Professional 1667x ou la ProGrade Digital CFexpress Type B Gold card offrent des vitesses élevées pour un traitement rapide des données. Pour l'organisation des cartes mémoire, le SmallRig SD Memory Card Holder est un ajout pratique et abordable. Avec ces recommandations, vous pouvez choisir des cadeaux qui améliorent véritablement l'expérience des photographes et vidéastes.
link
Les Vintages des Appareils Photo Numériques Ne Sont Pas Qu'un Mode. C'est Une Déclaration Artistique.
27 novembre 2024 13:00
Feed: All Latest
L'article examine le mouvement croissant parmi les photographes jeunes et créatifs qui délaissent les smartphones au profit des digicams vintage, souvent pour leur esthétique Y2K distincte. Ces appareils, caractérisés par des défauts tels que des images granuleuses et une faible résolution, sont désormais valorisés pour leur capacité à recréer un style photographique authentiquement ancien, contrastant avec la perfection des images modernes lissées par IA. Des appareils comme le Canon PowerShot G7 et le Kyocera Finecam S3 sont particulièrement prisés pour leur 'caractère' unique malgré leur infériorité technique par rapport aux standards actuels. La popularité de ces digicams a vu une augmentation notable de leur valeur sur le marché de la seconde main, stimulée par les vidéos et les discussions en ligne qui créent un buzz autour de modèles spécifiques. En outre, la collecte de ces appareils pose des problèmes logistiques, tels que l'accès aux batteries ou aux cartes mémoire obsolètes, et soulève des questions sur la durabilité et l'impact environnemental de la constante évolution technologique. En définitive, cet enthousiasme pour les digicams vintage révèle une nostalgie pour une époque révolue et un désir croissant de se distancer de la perfection inaccessible des technologies actuelles, tout en offrant une opportunité de créativité et d'expérimentation photographique à coût réduit.
link
Spotify cuts developer access to several of its recommendation features
27 novembre 2024 12:32
techcrunch
Spotify a introduit des restrictions significatives sur les fonctionnalités accessibles via son API Web, impactant les développeurs d'applications tierces. Ces restrictions incluent l'accès aux recommandations de chansons et d'artistes, l'analyse audio, et les caractéristiques des pistes musicales telles que la 'danceabilité' et l'énergie. L'objectif de Spotify est de protéger les habitudes d'écoute de ses utilisateurs et de préserver l'intégrité de ses propres modèles de recommandation musicale basés sur l'IA. Ces changements semblent être une réponse aux préoccupations croissantes concernant la sécurité et l'utilisation abusive des données par des applications exploitant son API pour entraîner des modèles AI concurrents. Ces restrictions affecteront principalement les développeurs n'ayant pas le statut de partenaire officiel, et ceux qui ont déjà demandé des extensions d'accès pourront continuer à utiliser les fonctionnalités concernées. La communauté de développeurs a exprimé son mécontentement, suggérant que les raisons de sécurité invoquées par Spotify pourraient masquer des motifs commerciaux, notamment la protection de ses investissements dans l'IA musicale.
link
Network for AI : Orange fait all-in sur l’IA, qui fera « vendre la 5G »
27 novembre 2024 10:14
Next - Flux Complet
Lors de la seconde édition des OpenTech Days d'Orange, Bruno Zerbib, CTIO, a annoncé un changement de cap pour l'événement, avec un focus sur les technologies prêtes pour la mise en production plutôt que sur la recherche fondamentale. Cet événement, remplaçant du Salon de la Recherche et de l'Innovation, a mis l'accent sur l'intelligence artificielle (IA), notamment par des applications avancées et des partenariats avec Meta et OpenAI pour développer des LLM dans les langues africaines régionales. L'IA multimodale, intégrant la voix et la vidéo, devient de plus en plus pertinente, et selon Zerbib, 40 % des interactions seront multimodales d'ici 2027. Orange s'adapte également pour vendre les avantages de la 5G, aidée par l'IA pour améliorer les débits et réduire la latence. La conférence a aussi abordé l'importance de la coopération entre les opérateurs télécoms et les entreprises technologiques pour le développement futur des réseaux et des services basés sur l'IA.
link
« Recherche sur la recherche », une métascience à la française émerge
27 novembre 2024 10:00
Sciences : Toute l’actualité sur Le Monde.fr.
La première réunion sur la métascience, tenue à Lyon par des chercheurs francophones, a marqué l'inauguration d’un champ scientifique qui se consacre à l'étude de la recherche. Ce domaine, initié par des sociologues, juristes, économistes et spécialistes de l'information, a pour ambition de mieux comprendre et réformer les pratiques scientifiques en réponse aux mutations actuelles. Parmi les principaux thèmes abordés figurent les changements dans les modes de financement et de diffusion des recherches, les défis de la science ouverte comme la reproductibilité des résultats et l'accès aux données de recherche. Les participants ont également discuté de l’adoption de méthodes quantitatives avancées et d'outils numériques pour analyser et améliorer l'efficacité de la recherche. La métascience est reconnue non seulement comme un domaine académique mais aussi comme un mouvement social, mettant en lumière la nécessité de systèmes d'évaluation et de protocoles plus robustes dans le domaine scientifique. L'événement a souligné le rôle de la France, notamment à travers le soutien du ministère de la Recherche et de l'Agence Nationale de la Recherche, dans la promotion de cette discipline émergente qui cherche à garantir une science de meilleure qualité pour l'avenir.
link
Oui, ce post viral sur LinkedIn que vous avez lu était probablement généré par IA
26 novembre 2024 20:00
Feed: All Latest
LinkedIn, le réseau social dédié aux professionnels, a massivement intégré l'intelligence artificielle (IA) dans ses fonctionnalités, offrant même des outils d'écriture IA aux abonnés de LinkedIn Premium. Selon une analyse partagée avec WIRED par la startup Originality AI, plus de 54 % des publications en anglais de plus de 100 mots sur LinkedIn seraient générées par IA. Cette intégration semble réussir, malgré le style souvent stéréotypé des contenus IA qui se confond avec le langage « corporate » habituel de la plateforme. L'adoption de l'IA a commencé à augmenter significativement en 2023 après le lancement de ChatGPT. Les utilisateurs de LinkedIn, y compris des non-anglophones et des rédacteurs de contenu, utilisent ces outils pour créer des ébauches de leurs publications ou peaufiner leur prose. Toutefois, l'utilisation de l'IA dans la rédaction suscite des controverses. Des artistes et écrivains s'opposent à l'utilisation de modèles linguistiques de grande envergure formés sur des œuvres humaines, arguant que cela dévalorise la création originale. Sur LinkedIn, où les interactions tendent à être professionnelles et neutres, l'utilisation de l'IA pour générer des contenus accrocheurs est en augmentation, aidant les utilisateurs à maintenir une présence active sans investir beaucoup de temps. Malgré certaines résistances, la qualité du contenu semble être le facteur déterminant pour l'acceptation des posts IA.
link
Agents Génératifs : Simulacres Interactifs du Comportement Humain
26 novembre 2024 14:12
arxiv
La recherche développée présente une avancée significative dans la création d'agents informatiques stimulés par IA, nommés 'agents génératifs', qui exhibent des comportements humanoïdes réalistes en environnement virtuel. Ces agents utilisent des modèles de langage avancés pour mémoriser et synthétiser des expériences, permettant une planification comportementale autonome et réactive. Pouvant cuisiner, travailler ou interagir socialement, ces agents ont été évalués dans une 'sandbox' simulant une petite ville, où ils exécutent des tâches et interagissent entre eux. L'évaluation a confirmé la crédibilité de leurs comportements individuels et sociaux, suggérant leur applicabilité dans des domaines tels que la formation interactive et les jeux vidéo. Cependant, le cadre soulève également des questions éthiques, notamment en ce qui concerne les risques de fausses relations sociales avec ces agents IA et nécessite des contrôles stricts pour éviter les abus potentiels tel que la désinformation et les deepfakes.
link
Introducing the Model Context Protocol
25 novembre 2024 17:15
anthropic
Aujourd'hui, nous avons dévoilé le Protocole de Contexte Modèle (MCP), une norme ouverte conçue pour établir des connexions sécurisées entre les sources de données et les outils alimentés par l'IA. Le MCP remplace les intégrations fragmentées par un protocole universel, permettant une architecture plus durable et une adoption généralisée par des entreprises telles que Block et Apollo. Les outils de développement tels que Zed et Replit utilisent également MCP pour améliorer la récupération d'informations pertinentes et optimiser le contexte autour des tâches de codage. Pour les développeurs, la création de serveurs MCP est facilitée par des SDK et des serveurs préconstruits pour des systèmes populaires tels que Google Drive et GitHub. L’adoption de ce protocole permet aux systèmes IA de maintenir le contexte en passant d'un outil à un autre, favorisant une innovation transparente et collaborative. Les développeurs peuvent dès à présent commencer à construire et tester des connecteurs MCP, avec un support dans l'application Claude Desktop et une communauté ouverte pour collaborer et partager des retours.
link
Les sous-titres de plus de 53 000 films et 85 000 épisodes de séries utilisés pour entraîner des IA
25 novembre 2024 14:20
Next - Flux Complet
Les entreprises développant des technologies d'intelligence artificielle génératives, comme OpenAI, NVIDIA, Meta et Apple, nécessitent d'énormes volumes de données textuelles pour entraîner efficacement leurs modèles linguistiques. Cela inclut l'utilisation controversée de sous-titres de films et de séries provenant d'archives comme The Pile, qui contient des milliers de fichiers potentiellement protégés par le droit d'auteur. Cette pratique a suscité des critiques, notamment en raison de procès intentés contre NVIDIA et d'autres sociétés pour violation du droit d'auteur. Malgré les déclarations de certaines de ces entreprises affirmant avoir détruit les données initiales, le débat demeure quant à l'éthique de telles méthodes. Les sous-titres, sources précieuses pour reproduire le style et le rythme des conversations humaines, posent particulièrement problème. Le syndicat des auteurs britanniques, WGGB, a exprimé une vive opposition à l'utilisation non rémunérée de ces travaux et a mené une campagne pour réclamer des compensations et une régulation adéquate. La situation met en lumière un conflit croissant entre les créateurs de contenu et les développeurs d'IA, créant un dialogue nécessaire sur les implications éthiques et légales de l'utilisation de telles données.
link
ou could have designed state of the art positional encoding
25 novembre 2024 09:08
huggingface
Dans son article, Christopher Fleetwood explore l'evolution de l'encodage positionnel dans les transformateurs, en passant des méthodes initiales à la technique avancée de RoPE (Rotary Positional Encoding). Cette évolution débute avec un ajout simple de la position des tokens qui se montre inefficace dû à des divergences dans les longueurs des séquences. Une idée intermédiaire consiste à utiliser l'encodage sinusoïdal détaillé dans l'article 'Attention Is All You Need', où les positions sont codées avec des fonctions sin et cos dont les fréquences varient. Cependant, cela présentait encore des limites liées à l'absoluité des positions. Fleetwood introduit ensuite RoPE, une méthode qui implémente une transformation rotationnelle dans l'encodage positionnel pour coder les positions relatives efficacement sans perturber l'information sémantique des tokens. Cette méthode utilise des matrices de rotation basées sur les positions des tokens et est adaptée aux entrées multimodales. Par le biais du passage de méthodes additives à multiplicatives, RoPE améliore significativement la performance des modèles en permettant des encodages qui respectent les propriétés nécessaires pour des systèmes d'apprentissage robustes, comme la conservation de l'unicité des positions et de la généralisation hors distribution. L'approche peut être étendue à des dimensions plus élevées, crucial pour des applications pratiques telles que le traitement des images. Fleetwood envisage de futurs développements pour l'encodage positionnel, inspirés du traitement du signal et des implémentations hiérarchiques.
link
🔴 OFF THE REC : Jean de la Rochebrochard
25 novembre 2024 07:53
Silicon Carne, un peu de picante dans un monde de Tech !
Dans un échange approfondi, Jean de La Rochebrochard partage ses réflexions sur l'évolution de l'écosystème entrepreneurial, en particulier entre la France et les États-Unis. Il discute de son expérience dans les fonds d'investissement, les décisions difficiles et les stratégies adoptées pour naviguer dans le monde fluctuant du capital-risque. Jean souligne l'importance de comprendre les marchés locaux, notamment les défis uniques que présentent les cultures d'affaires américaine et française. Il exprime également un intérêt particulier pour les startups qui, malgré leurs promesses, rencontrent des obstacles substantiels, telles que des difficultés à s'adapter aux conditions du marché ou à trouver un équilibre entre innovation et rentabilité. La discussion touche également les aspects plus personnels, comme les choix de vie et les motivations derrière les décisions de carrière, offrant ainsi une vision complète de son parcours et de ses perspectives pour l'avenir du secteur technologique et entrepreneurial.
link