Bộ dữ liệu về Arcade: Ngôn ngữ tự nhiên để tạo mã trong sổ tay máy tính tương tác

Arcade là tập hợp ngôn ngữ tự nhiên để viết mã lập trình các vấn đề trên sổ ghi chép khoa học dữ liệu tương tác. Mỗi vấn đề đều có đặc tính ngôn ngữ tự nhiên dưới dạng đặc tả vấn đề, giải pháp mã tham chiếu và bối cảnh sổ ghi chép trước đó (Đánh dấu hoặc ô mã). Arcade có thể được sử dụng để đánh giá độ chính xác của các mô hình ngôn ngữ lớn trong việc tạo ra các chương trình khoa học dữ liệu dựa trên hướng dẫn ngôn ngữ tự nhiên.

Pengchen Yin và Meg Risdal
Tổ chức
15/04/2024 15:05
15/04/2024 15:05
1.0
CC0: Public Domain
https://www.kaggle.com/datasets/googleai/arcade-nl2code-dataset
Trần Đức Phương
Cục Thông tin Khoa học và Công nghệ Quốc gia
126
0
STT Tên file dữ liệu Loại file Dung lượng Thao tác
1 Arcade.zip ZIP 3921 KB
Image