Bộ dữ liệu về các bài viết và bình luận hàng đầu trên Reddit

Bộ dữ liệu này chứa thông tin về 1000 bài viết hàng đầu từ ba cộng đồng Reddit phổ biến liên quan đến khoa học dữ liệu, bao gồm Machine Learning (Học Máy), Artificial Intelligence (Trí Tuệ Nhân Tạo) và Data Science (Khoa Học Dữ Liệu). Ngoài ra, bộ dữ liệu còn bao gồm tất cả các bình luận trên những bài viết đó. Bộ dữ liệu được thu thập thông qua API của Reddit và chứa các bình luận của bài viết hàng đầu mọi thời đại.

Tổ chức
14/10/2024 08:19
14/10/2024 08:23
1.0
CC0: Public Domain
https://www.kaggle.com/datasets/tushar5harma/topredditcomments
Trần Đức Phương
Cục Thông tin Khoa học và Công nghệ Quốc gia
24
0
STT Tên file dữ liệu Loại file Dung lượng Thao tác
1 Reddit.zip ZIP 62018 KB
Image