Catégorie : Cloud

L'essor des LLM open source : vers une intelligence artificielle plus démocratique et durable

L’inférence de l’IA chutera de plus de 90 %, mais la facture totale ne diminuera pas autant

L’économie de l’Intelligence Artificielle générative va radicalement se transformer au cours de cette décennie. Selon une nouvelle prévision de Gartner, d’ici 2030, l’inférence sur un grand modèle de langage de 1 billion de paramètres coûtera aux fournisseurs d’IA plus de 90 % de moins qu’en 2025. La société souligne également que les LLM de 2030 pourraient être jusqu’à 100 fois plus efficaces en termes de coût que les premiers modèles de taille comparable développés en 2022. Ce chiffre est remarquable mais peut aussi être trompeur s’il est interprété sans le contexte approprié. Car la nouvelle ne se résume pas uniquement à la baisse des coûts d’inférence. La véritable dimension essentielle concerne autre chose : le coût par token va diminuer,

Oracle E-Business Suite sous siège : une campagne d'extorsion exploite une vulnérabilité 0-day et oblige à des correctifs d'urgence

Oracle lance Fusion Agentic Applications et amène l’IA agentique au cœur de l’ERP

Oracle a dévoilé Fusion Agentic Applications, une nouvelle catégorie d’applications d’entreprise natives intégrées dans Oracle Fusion Cloud Applications. Avec cette initiative, la société cherche à dépasser le simple rôle de copilotes et d’assistants classiques. Elle affirme que ces applications ne se contentent pas de suggérer des tâches ou de répondre à des questions, mais qu’elles peuvent raisonner, décider et exécuter des actions au sein des processus métier en utilisant des données consolidées, des flux de travail, des hiérarchies d’approbation, des permissions et un contexte transactionnel en temps réel. La annonce a été faite le 24 mars 2026 lors de Oracle AI World à Londres. Ce qui distingue ce mouvement n’est pas seulement l’utilisation du terme « agentique », déjà largement

Sony bloquea las solicitudes de tarjetas SD y CFexpress por la presión en la memoria

Sony bloquea las solicitudes de tarjetas SD y CFexpress por la presión en la memoria

Sony a décidé de suspendre temporairement la réception de commandes pour une grande partie de ses cartes mémoire destinées à la photographie et à la vidéo au Japon. Cette mesure illustre une nouvelle fois à quel point la tension sur le marché mondial de la mémoire commence à impacter des produits très spécifiques de l’écosystème technologique. La société a annoncé le 27 mars 2026 qu’elle ne prend plus de nouvelles commandes pour plusieurs cartes CFexpress Type A, CFexpress Type B et SDXC/SDHC, aussi bien via ses distributeurs officiels que sur la Sony Store japonaise, invoquant une “pénurie mondiale de semi-conducteurs (mémoire)” et d’autres facteurs. Sony n’a pas communiqué de date de reprise, se contentant de préciser qu’elle réévaluera la situation

Samsung vise le 1 nm d'ici 2031, mais doit d'abord prouver que ses 2 nm fonctionnent réellement

Samsung vise le 1 nm d’ici 2031, mais doit d’abord prouver que ses 2 nm fonctionnent réellement

Samsung Foundry repense l’avenir de la miniaturisation avec un objectif ambitieux à long terme : atteindre le 1 nanomètre d’ici 2031. Selon le journal économique sud-coréen Korea Economic Daily, la division de fonderie de Samsung souhaite finaliser la R&D de ce nœud en 2030 pour ensuite le mettre en production. Elle prévoit s’appuyer sur une architecture innovante appelée forksheet afin d’accroître la densité de transistors sur une même surface de puce. Il convient de préciser qu’à ce stade, il ne s’agit pas d’une annonce officielle de Samsung, mais d’une feuille de route publiée par la presse locale, fondée sur des sources de l’industrie. Cette information s’inscrit dans une tendance plus large du secteur : face aux défis croissants du scaling

Huawei adopte Ascend à CUDA et gagne du terrain face à NVIDIA en Chine

Huawei adopte Ascend à CUDA et gagne du terrain face à NVIDIA en Chine

Huawei cherche à franchir l’un des plus grands obstacles qui ont protégé NVIDIA dans le domaine de l’intelligence artificielle : non seulement la puissance de ses accélérateurs, mais aussi la domination de CUDA en tant qu’environnement de développement de facto. Cette tendance se confirme avec l’intérêt croissant des grandes entreprises technologiques chinoises pour le nouveau Ascend 950PR, une puce qui, selon Reuters, commence à convaincre des clients comme ByteDance et Alibaba non pas tant par une supériorité brute en calcul, mais par une compatibilité accrue avec l’écosystème de développement auquel de nombreux développeurs IA sont déjà habitués. Huawei a depuis un certain temps progressé dans sa gamme Ascend et dans CANN, sa plateforme logicielle pour la computation en IA. Mais

L'essor des LLM open source : vers une intelligence artificielle plus démocratique et durable

L’inférence de l’IA chutera de plus de 90 %, mais la facture totale ne diminuera pas autant

L’économie de l’Intelligence Artificielle générative va radicalement se transformer au cours de cette décennie. Selon une nouvelle prévision de Gartner, d’ici 2030, l’inférence sur un grand modèle de langage de 1 billion de paramètres coûtera aux fournisseurs d’IA plus de 90 % de moins qu’en 2025. La société souligne également que les LLM de 2030 pourraient être jusqu’à 100 fois plus efficaces en termes de coût que les premiers modèles de taille comparable développés en 2022. Ce chiffre est remarquable mais peut aussi être trompeur s’il est interprété sans le contexte approprié. Car la nouvelle ne se résume pas uniquement à la baisse des coûts d’inférence. La véritable dimension essentielle concerne autre chose : le coût par token va diminuer,

Oracle E-Business Suite sous siège : une campagne d'extorsion exploite une vulnérabilité 0-day et oblige à des correctifs d'urgence

Oracle lance Fusion Agentic Applications et amène l’IA agentique au cœur de l’ERP

Oracle a dévoilé Fusion Agentic Applications, une nouvelle catégorie d’applications d’entreprise natives intégrées dans Oracle Fusion Cloud Applications. Avec cette initiative, la société cherche à dépasser le simple rôle de copilotes et d’assistants classiques. Elle affirme que ces applications ne se contentent pas de suggérer des tâches ou de répondre à des questions, mais qu’elles peuvent raisonner, décider et exécuter des actions au sein des processus métier en utilisant des données consolidées, des flux de travail, des hiérarchies d’approbation, des permissions et un contexte transactionnel en temps réel. La annonce a été faite le 24 mars 2026 lors de Oracle AI World à Londres. Ce qui distingue ce mouvement n’est pas seulement l’utilisation du terme « agentique », déjà largement

Sony bloquea las solicitudes de tarjetas SD y CFexpress por la presión en la memoria

Sony bloquea las solicitudes de tarjetas SD y CFexpress por la presión en la memoria

Sony a décidé de suspendre temporairement la réception de commandes pour une grande partie de ses cartes mémoire destinées à la photographie et à la vidéo au Japon. Cette mesure illustre une nouvelle fois à quel point la tension sur le marché mondial de la mémoire commence à impacter des produits très spécifiques de l’écosystème technologique. La société a annoncé le 27 mars 2026 qu’elle ne prend plus de nouvelles commandes pour plusieurs cartes CFexpress Type A, CFexpress Type B et SDXC/SDHC, aussi bien via ses distributeurs officiels que sur la Sony Store japonaise, invoquant une “pénurie mondiale de semi-conducteurs (mémoire)” et d’autres facteurs. Sony n’a pas communiqué de date de reprise, se contentant de préciser qu’elle réévaluera la situation

Samsung vise le 1 nm d'ici 2031, mais doit d'abord prouver que ses 2 nm fonctionnent réellement

Samsung vise le 1 nm d’ici 2031, mais doit d’abord prouver que ses 2 nm fonctionnent réellement

Samsung Foundry repense l’avenir de la miniaturisation avec un objectif ambitieux à long terme : atteindre le 1 nanomètre d’ici 2031. Selon le journal économique sud-coréen Korea Economic Daily, la division de fonderie de Samsung souhaite finaliser la R&D de ce nœud en 2030 pour ensuite le mettre en production. Elle prévoit s’appuyer sur une architecture innovante appelée forksheet afin d’accroître la densité de transistors sur une même surface de puce. Il convient de préciser qu’à ce stade, il ne s’agit pas d’une annonce officielle de Samsung, mais d’une feuille de route publiée par la presse locale, fondée sur des sources de l’industrie. Cette information s’inscrit dans une tendance plus large du secteur : face aux défis croissants du scaling

Huawei adopte Ascend à CUDA et gagne du terrain face à NVIDIA en Chine

Huawei adopte Ascend à CUDA et gagne du terrain face à NVIDIA en Chine

Huawei cherche à franchir l’un des plus grands obstacles qui ont protégé NVIDIA dans le domaine de l’intelligence artificielle : non seulement la puissance de ses accélérateurs, mais aussi la domination de CUDA en tant qu’environnement de développement de facto. Cette tendance se confirme avec l’intérêt croissant des grandes entreprises technologiques chinoises pour le nouveau Ascend 950PR, une puce qui, selon Reuters, commence à convaincre des clients comme ByteDance et Alibaba non pas tant par une supériorité brute en calcul, mais par une compatibilité accrue avec l’écosystème de développement auquel de nombreux développeurs IA sont déjà habitués. Huawei a depuis un certain temps progressé dans sa gamme Ascend et dans CANN, sa plateforme logicielle pour la computation en IA. Mais