Skip to content

Mẹo Công Nghệ

Mẹo Công Nghệ

  • Home » 
  • Máy Tính » 
  • AI Agent Điều Khiển Trình Duyệt: Giải Pháp Miễn Phí Thay Thế ChatGPT Operator?

AI Agent Điều Khiển Trình Duyệt: Giải Pháp Miễn Phí Thay Thế ChatGPT Operator?

By Administrator Tháng 8 1, 2025 0
AI agent tự động thực hiện tác vụ trên trình duyệt như con người
Table of Contents

Trong kỷ nguyên công nghệ số hiện đại, khái niệm về các tác nhân AI (AI agent) có khả năng điều khiển trình duyệt web và thực hiện các tác vụ như con người đã không còn là điều viển vông. Các công cụ mạnh mẽ như ChatGPT Operator đã chứng minh điều này, nhưng đi kèm với một mức giá không hề rẻ. Thay vì phải chi trả khoản phí lớn, nhiều người dùng công nghệ đã tìm kiếm một giải pháp thay thế miễn phí hoặc tiết kiệm chi phí – và kết quả thu được thực sự đáng kinh ngạc. Bài viết này sẽ đi sâu vào một lựa chọn mã nguồn mở đầy hứa hẹn, đồng thời chia sẻ kinh nghiệm thực tế về cách thiết lập và sử dụng nó để tự động hóa các tác vụ trên trình duyệt.

Browser Use: Lựa Chọn Mã Nguồn Mở Tối Ưu Cho AI Agent

ChatGPT Operator nổi bật với khả năng điều khiển trình duyệt web, tự động thực hiện các hành động như nhấp chuột hay cuộn trang. Người dùng chỉ cần ra lệnh cho ChatGPT về nhiệm vụ cần thực hiện, chẳng hạn như đặt vé hoặc nhập văn bản vào Google Docs, và công cụ này sẽ tự động làm theo. Tuy nhiên, để tiếp cận ChatGPT Operator, người dùng phải chi trả mức phí khá cao, khoảng 200 USD mỗi tháng cho gói ChatGPT Pro. Mức giá này rõ ràng là một rào cản lớn đối với nhiều cá nhân và doanh nghiệp nhỏ.

AI agent tự động thực hiện tác vụ trên trình duyệt như con ngườiAI agent tự động thực hiện tác vụ trên trình duyệt như con người

Trong bối cảnh đó, Browser Use đã xuất hiện như một giải pháp thay thế mã nguồn mở đầy tiềm năng. Tương tự như ChatGPT Operator, Browser Use có thể tương tác với trình duyệt web, điều hướng qua các trang web và thực hiện các hành động cần thiết. Điểm khác biệt lớn nhất nằm ở chi phí, khi Browser Use chỉ tốn một phần nhỏ so với đề xuất của ChatGPT.

Hiện tại, Browser Use cung cấp hai tùy chọn triển khai chính. Lựa chọn đầu tiên là đăng ký gói dịch vụ với mức phí khoảng 30 USD mỗi tháng, cho phép chạy AI agent trên dịch vụ đám mây của họ. Tùy chọn thứ hai, và cũng là phương án kinh tế nhất, là tự thiết lập Browser Use cục bộ trên máy tính của bạn. Với phương án này, bạn chỉ phải trả phí cho việc sử dụng API của các mô hình ngôn ngữ lớn (LLM), giúp tối ưu chi phí hơn rất nhiều. Hầu hết người dùng có xu hướng lựa chọn phương án cài đặt cục bộ để tiết kiệm tối đa.

Giao diện website Browser Use với các gói đăng ký và tùy chọn giáGiao diện website Browser Use với các gói đăng ký và tùy chọn giá

Mặc dù việc thiết lập Browser Use không đơn giản như ChatGPT Operator, nhưng với một vài dòng lệnh cơ bản, bạn hoàn toàn có thể đưa nó vào hoạt động.

Hướng Dẫn Chi Tiết Cài Đặt Browser Use Trên Máy Tính Cá Nhân

Để bắt đầu với Browser Use, bạn cần chuẩn bị hai yếu tố quan trọng: phiên bản Python 3.11 đã được cài đặt trên máy tính và quyền truy cập API từ OpenAI (hoặc một LLM được lưu trữ cục bộ nếu bạn muốn).

Browser Use là một AI agent, do đó nó yêu cầu một mô hình ngôn ngữ lớn (LLM) để có thể hoạt động hiệu quả. Bạn có thể lấy quyền truy cập API từ trang web của OpenAI hoặc bất kỳ API nào khác tương thích với Browser Use. Lợi ích của việc sử dụng API là bạn có thể linh hoạt lựa chọn giữa các mô hình khác nhau (như GPT-3.5 và GPT-4) và chỉ phải trả tiền cho những gì bạn sử dụng, thay vì một khoản phí đăng ký trả trước.

Trong quá trình thử nghiệm, mô hình ChatGPT 4-o đã được sử dụng và chi phí phát sinh cho bảy tác vụ yêu cầu Browser Use thực hiện là dưới 1 USD. Tuy nhiên, nếu bạn kết hợp nó với API của DeepSeek, chi phí có thể sẽ còn rẻ hơn đáng kể.

Một lựa chọn khác là sử dụng một LLM cục bộ trên máy tính của bạn. Tuy nhiên, việc chạy một LLM cục bộ có hiệu suất tương đương với ChatGPT 4-o đòi hỏi sức mạnh tính toán đáng kể, điều mà hầu hết người dùng thông thường khó có thể đáp ứng. Các thử nghiệm với mô hình LLM 7B của DeepSeek trên máy tính cá nhân cho thấy hiệu suất chưa thực sự tối ưu. Do đó, việc sử dụng API vẫn là lựa chọn được khuyến nghị ở thời điểm hiện tại.

Khi đã có quyền truy cập API, bạn có thể tạo một môi trường ảo trong VS Code. Truy cập View > Command Palette và nhập create environment. Sau đó, mở một terminal mới và cài đặt Browser-use bằng pip:

pip install browser-use

Tiếp theo, hãy tạo một tệp .env trong cùng thư mục và thêm khóa API của bạn vào đó:

OPENAI_API_KEY="Your API Here"

Cuối cùng, tạo một tệp Python mới với tên app.py và dán đoạn mã sau vào:

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
from dotenv import load_dotenv

load_dotenv()

async def main():
    agent = Agent(
        task="Go to Reddit, search for 'browser-use', click on the first post and return the first comment.",
        llm=ChatOpenAI(model="gpt-4o"),
    )
    result = await agent.run()
    print(result)

asyncio.run(main())

Bạn có thể thay thế phần task bằng lời nhắc của riêng mình, ví dụ: “Tìm kiếm Albert Einstein và mở trang Wikipedia của ông ấy.” Cuối cùng, chạy tệp app.py bằng terminal:

python app.py

Đánh Giá Thực Tế Hiệu Năng Của Browser Use

Việc thử nghiệm Browser Use bắt đầu với các tác vụ đơn giản, chẳng hạn như tìm kiếm “Albert Einstein” trên Google và mở trang Wikipedia của ông. Khi chạy đoạn mã, AI agent đã tự động mở một cửa sổ trình duyệt mới và thực hiện tác vụ một cách hoàn hảo.

Tiếp theo, yêu cầu AI agent tìm kiếm máy tính xách tay chơi game trên Amazon và mở kết quả đầu tiên. Một lần nữa, Browser Use đã hoàn thành nhiệm vụ thành công mà không gặp trở ngại.

Ở thời điểm này, người thử nghiệm tin rằng Browser Use có thể điều hướng web một cách thông minh. Để kiểm tra giới hạn của nó, AI agent được hướng dẫn truy cập Yahoo News và tóm tắt năm bài viết hàng đầu. Điều đáng ngạc nhiên là Browser Use đã hoàn thành tác vụ này trong vài phút, với các bản tóm tắt ngắn gọn và đúng trọng tâm.

Tuy nhiên, mọi thứ trở nên phức tạp hơn đối với Browser Use khi được yêu cầu tìm kiếm chuyến bay từ London đến Paris trên skyscanner.com. Ban đầu, trang web đã chặn quyền truy cập do phát hiện bot, yêu cầu sự can thiệp thủ công để vượt qua. Ngay cả sau khi vượt qua rào cản này, Browser Use vẫn gặp khó khăn—nó nhấp vào nút tìm kiếm mà không nhập chính xác “London” và “Paris” vào các trường tương ứng.

Mặc dù có khả năng kết nối Browser Use với trình duyệt chính nơi tất cả các tài khoản của bạn đã đăng nhập (cho phép AI agent nhập dữ liệu vào Google Sheet hoặc dán tóm tắt Yahoo News vào Google Doc), nhưng trong quá trình thử nghiệm, việc thiết lập với trình duyệt đang hoạt động gặp phải một số vấn đề và đã được tạm hoãn.

Kết Luận

Tổng thể, đây là một thử nghiệm thú vị khi chứng kiến một AI agent tự động điều hướng web và thực hiện các tác vụ. Mặc dù Browser Use chưa hoàn hảo và vẫn còn một chặng đường dài để trở thành một AI agent vững chắc có thể duyệt web độc lập hoàn toàn, công nghệ này vẫn còn ở giai đoạn sơ khai và chúng ta có thể kỳ vọng vào những cải tiến đáng kể trong tương lai.

Đối với hiện tại, nếu bạn sẵn lòng tìm hiểu sâu hơn về cách thiết lập và không ngại những sự cố nhỏ không thường xuyên, hãy thử cài đặt Browser Use trên máy tính của mình. Đây là một công cụ tiềm năng, giúp bạn khám phá khả năng tự động hóa web bằng AI mà không tốn quá nhiều chi phí. Hãy chia sẻ ý kiến của bạn về Browser Use hoặc bất kỳ khó khăn nào gặp phải trong quá trình cài đặt và sử dụng trong phần bình luận bên dưới!

Share
facebookShare on FacebooktwitterShare on TwitterpinterestShare on Pinterest
linkedinShare on LinkedinvkShare on VkredditShare on ReddittumblrShare on TumblrviadeoShare on ViadeobufferShare on BufferpocketShare on PocketwhatsappShare on WhatsappviberShare on ViberemailShare on EmailskypeShare on SkypediggShare on DiggmyspaceShare on MyspacebloggerShare on Blogger YahooMailShare on Yahoo mailtelegramShare on TelegramMessengerShare on Facebook Messenger gmailShare on GmailamazonShare on AmazonSMSShare on SMS
Post navigation
Previous post

OnePlus 13 Ra Mắt: Vì Sao OnePlus 12 Vẫn Là Lựa Chọn “Đáng Tiền” Nhất?

Next post

Khả Năng Sửa Chữa Điện Thoại: Yếu Tố Quyết Định Tuổi Thọ Thiết Bị Của Bạn

Administrator

Related Posts

Categories Máy Tính AI Agent Điều Khiển Trình Duyệt: Giải Pháp Miễn Phí Thay Thế ChatGPT Operator?

Tại Sao Máy Tính Để Bàn Bền Bỉ Hơn Laptop Theo Thời Gian?

Categories Máy Tính AI Agent Điều Khiển Trình Duyệt: Giải Pháp Miễn Phí Thay Thế ChatGPT Operator?

Meta AI Biến Ảnh Tĩnh Thành Video: Trải Nghiệm Thú Vị Đến Bất Ngờ

Categories Máy Tính AI Agent Điều Khiển Trình Duyệt: Giải Pháp Miễn Phí Thay Thế ChatGPT Operator?

9 Tiện Ích Windows Kinh Điển Vẫn Cực Hữu Dụng Trong Thế Giới Hiện Đại

Leave a Comment Hủy

Recent Posts

  • Tại Sao Máy Tính Để Bàn Bền Bỉ Hơn Laptop Theo Thời Gian?
  • Meta AI Biến Ảnh Tĩnh Thành Video: Trải Nghiệm Thú Vị Đến Bất Ngờ
  • 9 Tiện Ích Windows Kinh Điển Vẫn Cực Hữu Dụng Trong Thế Giới Hiện Đại
  • Tai Nghe Cao Cấp: Khi Nào “Xa Xỉ” Là Đủ Và Tai Nghe Phổ Thông Vẫn VƯỢT TRỘI?
  • 6 Công Cụ Chỉnh Sửa PDF Mã Nguồn Mở Và Miễn Phí Tốt Nhất 2024

Recent Comments

Không có bình luận nào để hiển thị.
Copyright © 2025 Mẹo Công Nghệ - Powered by Nevothemes.
Offcanvas
Offcanvas

  • Lost your password ?