


Andke /automatiseerige ülesanne lihtsas inglise keeles ja see juhib reaalset brauserit seda tegema: navigeerige saidil, klõpsake läbi mitmeastmelise voo, täitke vorm, jõudke lehele, mis renderdub alles pärast interaktsiooni. Tulemus voogesitatakse tagasi ühe API-kõnega. See on API, mida kutsute, mitte raamistik, mille installite. Brauser ja LLM on kaasas, midagi pole vaja majutada, puudub samaaegsuse piirang. Juurdepääsetavuspuu automatiseerimine kasutab 60–80% vähem tokeneid kui ekraanipõhised agendid. Ehitatud Mozilla poolt. Efemeerne, teie andmetel ei treenita.
Tabstack Browser Automation on API, mis võimaldab sul kirjeldada veebiülesannet tavalises inglise keeles ja lasta see täita reaalses brauseris. Sa annad sellele ülesande nagu "Leia odavaim otselend SFO-st JFK-sse, mis väldib tipptundi, ja lisa see ostukorvi," ning Tabstack navigeerib, klõpsab, täidab vorme ja sooritab mitmeastmelisi toiminguid lehtedel, mida sa ei kontrolli. Nii brauser kui ka LLM töötavad Tabstacki infrastruktuuril – sa teed lihtsalt ühe API päringu ja saad valmis tulemuse tagasi. Selle on loonud Mozilla, see kasutab ekraanipiltide asemel ligipääsetavuspuud ning hoiab sinu andmeid ajutistena, ilma et sinu sisendite põhjal koolitust tehtaks.
Tabstack kaotab kogu brauseri automatiseerimise virna. Pole vaja raamistikku installida, mudelit ühendada ega brauserit majutada. Sa kutsud /automate koos tavakeelse ülesande ja URL-iga ning teenus tegeleb kõigega – navigeerimise, klõpsamise, vormide täitmise ja tulemuste ekstraheerimisega –, saates sündmusi reaalajas tagasi.
Selle asemel, et saata täislehekülje pilte igal toimingul (mis põletab tuhandeid visioonitokeneid), loeb Tabstack brauseri ligipääsetavuspuud. See kompaktne struktureeritud tekst – nupp "Otsi", tekstiväli "E-posti aadress", link "Hinnakiri" – kasutab 60 kuni 80% vähem tokeneid tegevuse kohta kui ekraanipildipõhised agendid. Suures mahus on see reaalne kulude erinevus, mitte väike optimeerimine.
Agent töötab JS-i rasketel, dünaamilistel ja autenditud lehtedel, millega haprad skriptid hakkama ei saa. Kui ta puutub kokku millegagi, mida tal pole – näiteks sisselogimisvormiga –, peatub ta ja küsib sisendit, mitte ei arva ega ebaõnnestu. Sa saad määrata interactive: true, et esitada volitusandmeid või muid tundlikke andmeid vastavalt vajadusele, ja turvapiirded hoiavad agendi lubatud tegevuste piires.
API voogedastab ülesande sündmusi SSE kaudu, kui agent töötab, nii et saad edenemist reaalajas jälgida. Kui ülesanne on lõppenud, saad puhta lõpliku vastuse – mitte tooreid leheandmeid. Interaktiivne režiim võimaldab sul ülesande keskel vormivälju täita, muutes selle turvaliseks autenditud voogude jaoks, ilma et sinu volitusandmeid kunagi salvestataks.
"Tabstack loeb ekraanipiltide asemel ligipääsetavuspuud, nii et iga tegevus maksab murdosa sellest, mida visioonipõhised agendid kulutavad."
See on põhiline arhitektuuriline erinevus. Enamik brauseri automatiseerimise agente saadab igal sammul täislehekülje ekraanipildi, põletades tuhandeid visioonitokeneid tegevuse kohta. Tabstacki ligipääsetavuspuu lähenemine vähendab tokenite tarbimist 60 kuni 80%, mis tähendab otseselt madalamaid kulusid suures mahus. Koos sellega, et brauser ja mudel on täielikult hallatud (pole vaja midagi majutada, pole konkurentsipiirangut), muudab see suuremahulise automatiseerimise esimest korda majanduslikult elujõuliseks.
Sa pead automatiseerima mitmeastmelisi veebiülesandeid lehtedel, mida sa ei kontrolli – broneerimiste tegemine, vormide täitmine, andmete ekstraheerimine JS-i rasketelt saitidelt – ja soovid vältida brauseri automatiseerimise virna üles seadmise kulusid ja keerukust. Tabstack on eriti veenev, kui sa skaleerid automatiseerimist ja ekraanipildipõhiste agentide tokenite kulud söövad su eelarvet. See sobib hästi ka siis, kui vajad autenditud voogude või tundlike toimingute jaoks inimest ahelas.
Teised tööriistad, mida võiksid kaaluda
Loading comments…
Looja
blueprint_b
KĂĽlasta veebisaiti
tabstack.ai/browser-automation
Projekti info
Toote märksõnad