Mô tả công việc
THƯ VIỆN PHÁP LUẬT đang phát triển các ứng dụng AI trong Ngành Luật. Mời Bạn tham gia đội kỹ sư AI pháp luật, phát triển các tiện ích giúp 8 triệu người dùng tra cứu, hiểu và áp dụng pháp luật dễ dàng hơn.
Tuỳ theo năng lực chuyên sâu (NLP hoặc Dữ liệu), bạn sẽ cùng đội kỹ sư đảm nhiệm những việc sau:
- Xây dựng hệ thống tìm kiếm pháp luật thông minh:
- Hiểu ngôn ngữ tự nhiên của người dùng (câu hỏi pháp lý) và liên kết đến điều khoản phù hợp.
- Áp dụng mô hình NLP tiếng Việt: embedding, transformers, RAG...
- Đảm bảo hệ thống hoạt động hiệu quả với số lượng người dùng lớn lên đến hàng chục ngàn người sử dụng cùng lúc.
- Xây dựng AI tóm tắt, diễn giải, so sánh văn bản pháp luật:
- Tự động rút gọn, chuyển ngữ chính xác nội dung luật sang ngôn ngữ phổ thông, thân thiện.
- So sánh với các văn bản luật khác tương đương.
- Phát triển hệ thống gợi ý nội dung pháp luật:
- Phân tích lịch sử hành vi người dùng
- Phát triển hệ thống gợi ý bài viết, điều luật, công cụ phù hợp với cá nhân người dùng.
- Nâng cao trải nghiệm người dùng, tăng tỉ lệ click và giảm tỉ lệ thoát trang.
- Xây dựng hệ thống sinh văn bản mẫu pháp lý:
- Xây dựng LLM sinh văn bản hợp đồng, công văn, đơn từ, theo logic pháp lý đã chuẩn hoá tại Thư Viện Pháp Luật.
- Xử lý dữ liệu pháp luật phục vụ AI:
- Làm sạch, phân đoạn, chuẩn hoá và tổ chức dữ liệu (văn bản luật, bài viết, Q&A, log hành vi, …)
- Thiết kế & phát triển ETL pipelines cho dữ liệu
- Xây dựng & tối ưu kho dữ liệu (Data Warehouse)
- Tạo pipeline dữ liệu để phục vụ truy xuất chính xác, nhanh chóng.
- Kết nối với đội lập trình web nội bộ để tích hợp AI vào sản phẩm thực tế.
Yêu cầu công việc
Bạn cần có năng lực tối thiểu 2/3 nhóm công việc sau:
Nhóm A – NLP & AI tiếng Việt:
- Có tối thiểu1 năm kinh nghiệm làm việc trong mảng NLP như Q-A system, text classification, NER, recommend system ..
- Xây dựng được hệ thống semantic search / QA / tóm tắt tiếng Việt.
- Biết cách dùng, huấn luyện, tinh chỉnh, tích hợp các mô hình như transformer-based models (BERT, GPT), sequence-to-sequence models, LLM (GPT, Gemini, . . .)
- Thành thạo Python, HuggingFace Transformers, LangChain hoặc tương tự.
Nhóm B – Xử lý dữ liệu pháp luật:
- Thành thạo xử lý dữ liệu văn bản (text cleaning, segmentation, metadata tagging);
- Có kinh nghiệm tạo pipeline dữ liệu bằng Python (Pandas, Pydantic, FastAPI...);
- Từng làm việc với dữ liệu dạng quy định, luật, tiêu chuẩn, hoặc có tư duy hệ thống hóa văn bản hành chính;
Nhóm C – Triển khai & tối ưu hệ thống:
Có kinh nghiệm:
- Thiết kế pipeline CI/CD cho hệ thống AI
- Container hóa và orchestration on-premise (Docker, Kubernetes, Docker Swarm)
- Triển khai mô hình AI dưới dạng API (FastAPI/Flask, TorchServe, Uvicorn) trên hạ tầng nội bộ
- Giám sát hệ thống với Prometheus/Grafana, ELK Stack hoặc tương đương
- Thiết lập autoscaling & high-availability (load-balancer, VPN, firewall)
- Có kinh nghiệm container hoá và quản lý orchestration on-premise (Docker, Kubernetes, Docker Swarm).
ƯU TIÊN
- Ứng viên đã vận hành hệ thống traffic lớn hoặc xử lý tiếng Việt sâu trên hạ tầng nội bộ;
- Có hiểu kiến thức xã hội, quan tâm đến chính trị, pháp luật, thế giờ, hoặc từng làm việc với dữ liệu ngôn ngữ tiếng Việt / tài chính / văn bản nhà nước;
- Từng làm trong startup AI / sản phẩm NLP tiếng Việt;
- Biết đọc hiểu tiếng Anh chuyên ngành AI, chủ động cập nhật công nghệ mới;