


Donnez / automatisez une tâche en anglais simple et il pilote un vrai navigateur pour l'exécuter : naviguer sur un site, cliquer à travers un flux en plusieurs étapes, remplir un formulaire, atteindre une page qui ne s'affiche qu'après une interaction. Le résultat est renvoyé en continu via un seul appel API. C'est une API que vous appelez, pas un framework que vous installez. Navigateur et LLM inclus, rien à héberger, aucun plafond de concurrence. L'automatisation par arbre d'accessibilité consomme 60 à 80 % de tokens en moins que les agents basés sur des captures d'écran. Développé par Mozilla. Éphémère, aucune formation sur vos données.
Tabstack Browser Automation est une API qui vous permet de décrire une tâche web en langage courant et de l'exécuter dans un véritable navigateur. Vous lui confiez une tâche comme « Trouve le vol direct le moins cher de SFO à JFK qui évite les heures de pointe et ajoute-le au panier », et Tabstack navigue, clique, remplit des formulaires et exécute des flux multi-étapes sur des pages que vous ne contrôlez pas. Le navigateur et le LLM fonctionnent tous deux sur l'infrastructure de Tabstack : vous faites un seul appel API et récupérez le résultat final. Développé par Mozilla, il utilise l'arbre d'accessibilité plutôt que des captures d'écran, et vos données sont éphémères, sans entraînement sur vos entrées.
Tabstack élimine toute la pile d'automatisation de navigateur. Pas de framework à installer, pas de modèle à intégrer, pas de navigateur à héberger. Vous appelez /automate avec une tâche en langage courant et une URL, et le service gère tout — navigation, clics, remplissage de formulaires et extraction des résultats — en diffusant des événements en temps réel pendant son exécution.
Au lieu d'envoyer des images pleine page à chaque action (ce qui consomme des milliers de tokens de vision), Tabstack lit l'arbre d'accessibilité du navigateur. Ce texte structuré compact — bouton « Rechercher », zone de texte « Adresse e-mail », lien « Tarifs » — utilise 60 à 80 % de tokens en moins par action par rapport aux agents basés sur des captures d'écran. À grande échelle, cela représente une véritable différence de coût, et non une simple optimisation mineure.
L'agent fonctionne sur des pages dynamiques, lourdes en JavaScript et authentifiées, qui font échouer les scripts fragiles. Lorsqu'il rencontre quelque chose qu'il ne possède pas — comme un formulaire de connexion — il s'arrête et demande une entrée plutôt que de deviner ou d'échouer. Vous pouvez définir interactive: true pour fournir des identifiants ou d'autres données sensibles à la demande, et des garde-fous maintiennent l'agent dans les actions que vous autorisez.
L'API diffuse les événements de tâche via SSE pendant que l'agent travaille, vous permettant de suivre la progression en temps réel. Une fois la tâche terminée, vous obtenez une réponse finale claire — et non des données de page brutes. Le mode interactif vous permet de fournir des champs de formulaire en cours de tâche, ce qui le rend sûr pour les flux authentifiés sans jamais stocker vos identifiants.
« Tabstack lit l'arbre d'accessibilité au lieu de prendre des captures d'écran, donc chaque action coûte une fraction de ce que dépensent les agents basés sur la vision. »
C'est la différence architecturale fondamentale. La plupart des agents d'automatisation de navigateur envoient une capture d'écran pleine page à chaque étape, brûlant des milliers de tokens de vision par action. L'approche basée sur l'arbre d'accessibilité de Tabstack réduit la consommation de tokens de 60 à 80 %, ce qui se traduit directement par des coûts plus bas à grande échelle. Combiné au fait que le navigateur et le modèle sont entièrement gérés (rien à héberger, pas de plafond de concurrence), cela rend l'automatisation à volume élevé économiquement viable pour la première fois.
Vous devez automatiser des tâches web multi-étapes sur des pages que vous ne contrôlez pas — réservations, remplissage de formulaires, extraction de données de sites lourds en JavaScript — et vous souhaitez éviter le coût et la complexité de la mise en place d'une pile d'automatisation de navigateur. Tabstack est particulièrement intéressant si vous passez à l'échelle de l'automatisation et que les coûts de tokens des agents basés sur des captures d'écran grignotent votre budget. C'est également un bon choix si vous avez besoin d'une intervention humaine pour les flux authentifiés ou les opérations sensibles.
D'autres outils que vous pourriez envisager
Loading comments…
Créateur
blueprint_b
Visiter le site web
tabstack.ai/browser-automation
Infos du projet
Mots-clés du produit