Bộ dữ liệu này chứa các cặp câu hỏi và câu trả lời kèm theo ngữ cảnh được trích xuất từ các bài viết giải pháp và diễn đàn thảo luận trên Kaggle. Bộ dữ liệu được tạo ra nhằm hỗ trợ tinh chỉnh Gemma, một mô hình AI, cho các nhiệm vụ hỗ trợ nhà khoa học dữ liệu như trả lời câu hỏi và cung cấp hỗ trợ liên quan đến khoa học dữ liệu.
Về Bộ Dữ LiệuBộ dữ liệu này chứa thông tin chi tiết về các công việc trong lĩnh vực AI/ML và Khoa học Dữ liệu. Ngoài ra, nó bao gồm mô tả công việc và các kỹ năng quan trọng cần thiết để ứng tuyển vào từng vị trí cụ thể.
Bộ dữ liệu này được thu thập thông qua quy trình web scraping từ Google Playstore, rất phù hợp cho các ứng dụng phân tích cảm xúc trong lĩnh vực kinh doanh, đặc biệt là khởi nghiệp. Nó cung cấp những thông tin quý giá có thể được sử dụng cho mục đích học tập hoặc nghiên cứu sâu hơn. Bộ dữ liệu bao gồm các đánh giá từ các ứng dụng phổ biến tại Indonesia, như:Gojek (116.017 đánh giá, hơn 100 triệu lượt tải xuống): Siêu ứng dụng cung cấp các dịch vụ như gọi xe, giao đồ ăn, thanh toán trực tuyến và...
Giới thiệu về bộ dữ liệu:Bộ dữ liệu này gồm hai cột: 1. Số giờ học tập của sinh viên. 2. Điểm số họ đạt được.Dữ liệu này có thể được sử dụng để áp dụng hồi quy tuyến tính đơn giản nhằm dự đoán điểm số của học sinh dựa trên số giờ học tập. Ứng dụng của bộ dữ liệu: - Phân tích mối quan hệ giữa thời gian học tập và kết quả học tập. - Phát triển mô hình dự đoán điểm số dựa trên thời gian học.
LinkedIn là một nền tảng mạng lưới chuyên nghiệp được sử dụng rộng rãi và lưu trữ hàng triệu tin tuyển dụng.Bộ dữ liệu này chứa 1,3 triệu tin tuyển dụng được thu thập từ LinkedIn trong năm 2024. Bộ dữ liệu có thể được sử dụng cho nhiều mục đích nghiên cứu, bao gồm: - Phân tích thị trường lao động.- Xây dựng bản đồ kỹ năng. - Hệ thống gợi ý việc làm. - Và các nghiên cứu khác liên quan đến tuyển dụng và xu hướng công việc.
Bộ dữ liệu này chứa thông tin về hiệu suất và thành tích của sinh viên ngành Khoa học Máy tính trong nhiều môn học và hoạt động khác nhau. Nó bao gồm tổng cộng 8965 mục với 25 biến đặc trưng và không có biến mục tiêu (xem bên dưới). Tập dữ liệu bao gồm cả các biến liên tục và biến phân loại liên quan đến thành tích học tập, phát triển kỹ năng và thành tựu dự án.