Mais au fait, c’est quoi l’Open Knowledge Format (OKF) ?

Présenté par Google, l’Open Knowledge Format (OKF) est un standard ouvert qui structure les connaissances d’une entreprise pour les rendre exploitables par les agents IA. Décryptage.

Le bundle OKF est composé de quelques éléments en YAML. © Google/Montage BDM

Sommaire

Les agents IA sont de plus en plus capables, mais ils butent toujours sur une contrainte tenace : la qualité du contexte qu’on leur fournit. Pour les connecter aux outils et aux données, l’industrie a multiplié les briques, du MCP à la RAG. Google y ajoute une nouvelle pièce avec l’Open Knowledge Format (OKF), un standard ouvert dévoilé le 12 juin 2026 pour représenter les connaissances d’une organisation dans un format commun à tous les agents. On vous explique.

Pourquoi les agents IA ont-ils besoin d’un format de connaissances commun ?

Aussi puissant soit-il, un modèle de langage ne connaît pas le sens d’une métrique propre à votre entreprise, le schéma d’une table de données interne ou la procédure à suivre en cas d’incident. Ces connaissances métier, indispensables aux agents IA, sont aujourd’hui éparpillées dans des systèmes qui ne communiquent pas entre eux : catalogues de métadonnées avec leurs propres API, wikis, lecteurs partagés, commentaires dans le code, et parfois uniquement dans la tête de quelques ingénieurs expérimentés.

Ainsi, chaque fois qu’une équipe construit un nouvel agent, elle doit reconstituer ce contexte à partir de sources dispersées et incompatibles. Chaque éditeur réinvente son propre modèle de données et le savoir reste prisonnier de l’outil qui l’a produit. Pour Google, la réponse à ce problème n’est pas un énième service, mais un format : une manière de représenter la connaissance que tout le monde peut produire sans SDK (kit de développement), consommer sans intégration, et qui survit au passage d’un système à un autre.

Comment fonctionne l’Open Knowledge Format ?

Dans sa version 0.1, l’OKF est volontairement minimaliste. Il formalise le « patron LLM-wiki » décrit par le chercheur Andrej Karpathy, qui résumait ainsi l’intérêt de confier la maintenance d’une base de connaissances à une IA : les LLM « ne se lassent jamais et n’oublient pas de mettre à jour une référence croisée ». Concrètement, une base OKF repose sur trois principes simples :

Du simple Markdown : lisible dans n’importe quel éditeur, affichable directement sur GitHub et indexable par n’importe quel outil de recherche.
De simples fichiers : livrables sous forme d’archive, hébergeables dans un dépôt Git et accessibles depuis n’importe quel système de fichiers.
Du YAML en en-tête : pour le petit ensemble de champs structurés qui doivent rester interrogeables, à savoir le type, le titre, la description, la ressource, les tags et l’horodatage.

Chaque fichier décrit un « concept » : une table, un jeu de données, une métrique, une procédure ou une API. Son chemin d’accès dans l’arborescence fait office d’identifiant et les concepts se relient entre eux par de simples liens Markdown. L’ensemble forme ainsi un graphe de connaissances, bien plus riche qu’une simple hiérarchie de dossiers. Un dossier complet (ce que Google appelle un bundle) peut aussi contenir des fichiers d’index, pour guider l’agent dans sa navigation, et un journal des modifications.

Pour rendre le format concret, Google a publié sa spécification sur GitHub, accompagnée de plusieurs implémentations de référence : un agent capable de documenter automatiquement un jeu de données BigQuery, un visualiseur HTML qui transforme une base OKF en graphe interactif, et trois exemples prêts à l’emploi. Le Knowledge Catalog de Google Cloud peut par ailleurs déjà ingérer nativement le format.

OKF et RAG, quelle différence ?

La RAG est une technique de récupération : au moment d’une requête, le système va chercher des documents pertinents et les injecte dans le contexte du modèle. L’OKF, lui, est un format de représentation qui organise la connaissance en amont. Les deux se complètent : plutôt que de charger toute une base documentaire dans la fenêtre de contexte pour y appliquer une RAG, un agent peut parcourir un bundle OKF et n’aller chercher que les concepts utiles. L’OKF structure le savoir, la RAG (puis l’agent) l’exploite.

Ce que ça change pour les professionnels du digital

Si l’OKF cible d’abord les équipes data et les développeurs, sa logique pourrait déborder largement ce cadre. Pour les professionnels du SEO et du marketing, il prolonge une bascule déjà engagée avec l’essor des agents. On ne cherche plus seulement à être trouvé par les moteurs de recherche, mais à rendre ses connaissances directement exploitables par des agents capables d’agir. Certains spécialistes y voient l’émergence d’une nouvelle expertise, consistant à transformer le savoir épars d’une entreprise en une base structurée et activable.

Reste que le format n’en est qu’à ses débuts. Google présente lui-même l’OKF v0.1 comme un point de départ, appelé à évoluer au fil des retours. Surtout, la valeur d’un standard de ce type dépend du nombre d’acteurs qui l’adoptent : publié par Google mais conçu comme neutre vis-à-vis des plateformes, l’OKF ne tiendra ses promesses que si un véritable écosystème de producteurs et de consommateurs se met en place autour de lui.

Sujets liés :