Blog

Đề thi Data Analyst (Phần 1) – Full đề thi thực tế từ Home Credit

Đề thi Data Analyst (Phần 1)

Bộ đề thi Data Analyst thực tế do INDA Academy tổng hợp

Để giúp người học làm quen với các dạng bài test trong quá trình tuyển dụng, INDA Academy đã tổng hợp và chọn lọc các đề thi Data Analyst thực tế từ doanh nghiệp.

Trong đó, bài test từ Home Credit là một ví dụ điển hình, thường được sử dụng để đánh giá ứng viên ở các vị trí Data Analyst, đặc biệt trong lĩnh vực tài chính – tín dụng.

Bộ đề này bao gồm các phần kiểm tra cốt lõi:

  • SQL (truy vấn và xử lý dữ liệu)
  • Logical thinking (tư duy suy luận)
  • Business Analytics (phân tích dữ liệu kinh doanh)

Toàn bộ nội dung được giữ nguyên từ đề gốc, bao gồm bảng dữ liệu và câu hỏi, nhằm đảm bảo tính xác thực và giúp người học có trải nghiệm sát nhất với thực tế.

Đề thi Data Analyst – Phần 1 dành cho ai và cách luyện tập

Đây là Phần 1 trong series “Đề thi Data Analyst”, tập trung vào các dạng câu hỏi nền tảng, phù hợp với:

  • Sinh viên đang tìm kiếm vị trí data analyst intern
  • Người mới bắt đầu học Data
  • Ứng viên chuẩn bị cho các vòng test đầu vào

Bạn có thể sử dụng bài test này như một bài luyện tập hoàn chỉnh:

  • Làm toàn bộ đề trong điều kiện không tra cứu
  • Ghi lại cách tiếp cận và reasoning
  • Sau đó mới đối chiếu với đáp án (nếu có)

Việc luyện tập với các đề thi thực tế sẽ giúp bạn hiểu rõ hơn cách doanh nghiệp đánh giá năng lực Data Analyst, từ đó cải thiện cả kỹ năng kỹ thuật và tư duy phân tích.

Nội dung bài test

PHẦN I: KIỂM TRA SQL (SQL TEST)

1. Cấu trúc dữ liệu (Data Structure)

Bảng: view_credit (Bảng dữ liệu các khoản vay)

IDDATECREDIT_AMOUNTID_PERSONPAYMENT_NUMINTEREST
100103.09.200640000500160,15
100210.09.200630000500270,19
100313.09.200630000500380,25
100423.09.200625000500490,17
101122.09.200730000500960,22
101211.11.2007620005003110,25
100523.09.200640000500550,18
100626.09.200630000500660,13
100703.10.200630000500750,19
100809.10.2006250005008100,22
100911.10.2006500005009120,25
101012.10.2006550005010120,11

Bảng: view_person (Bảng dữ liệu thông tin khách hàng)

ID_PERSONDATE_BIRTHNAME1NAME2NAME3CHILD_NUM
500103.09.1985IgorLevy 0
500213.05.1954IljaMuromecBlazen0
500326.09.1980MartinZahalka 1
500411.04.1949FrantisekPravyLotr2
500523.08.1974SergeyPandaZlobr3
500626.09.1974MaximGross 2
500703.12.1981VladimirHavel 1
500809.10.1965LumirRobinsonZubejda1
500921.06.1977JiriMaratHele1
500030.01.1993JohnSmith 0
501125.11.1932MartinSchmidt 2
501012.08.1980JanMarek 0

2. Câu hỏi trắc nghiệm SQL

Câu hỏi 1: Câu lệnh truy vấn nào trả về thông tin chi tiết về tất cả các khoản vay và khách hàng tương ứng đã nhận các khoản vay đó?

A. select * from view_credit c right join view_person p on c.id = p.id_person

B. select * from view_credit c join view_person p on p.id_person = c.id_person

C. select * from view_credit c left join view_person p on p.id_person = c.id_person

D. select * from view_credit c full outer join view_person p on p.id_person = c.id_person

Câu hỏi 2: Câu lệnh truy vấn nào trả về thông tin chi tiết về tất cả khách hàng và các khoản vay mà họ đã nhận (nếu có)?

A. select * from view_person p join view_credit c on p.id_person = c.id_person

B. select * from view_credit c join view_person p on p.id_person = c.id_person

C. select * from view_credit c left join view_person p on p.id_person = c.id_person

D. select * from view_person p left join view_credit c on p.id_person = c.id_person

Câu hỏi 3: Câu lệnh truy vấn nào trả về thông tin của tất cả những khách hàng không có bất kỳ khoản vay nào?

A. select c.* from view_person p left join view_credit c on p.id_person = c.id_person where c.id_person is null

B. select p.* from view_person p left join view_credit c on p.id_person = c.id_person where c.id is null

C. select p.* from view_person p where p.id_person not in (select p.id_person from view_credit)

D. select p.* from view_person p where p.id_person not in (select c.id_person from view_credit c where p.id_person = c.id_person)

Câu hỏi 4: Câu lệnh truy vấn nào trả về thông tin của tất cả những khách hàng có nhiều hơn một khoản vay?

A. select p.* from view_person p where (select count(c.id) from view_credit c where c.id_person=p.id_person)>1

B. select p.* from view_person p where (select count(c.id) from view_credit c where c.id_person=p.id_person)=2

C. select p.* from view_person p join (select count(*) k, c.id_person from view_credit c group by c.id having count(*) > 1) g on p.id_person=g.id_person

D. select p.* from view_person p join (select count(*) k, c.id_person from view_credit c group by c.id_person where count(*) > 1) g on p.id_person=g.id_person

Câu hỏi 5: Câu lệnh truy vấn nào trả về bảng kết quả dưới đây (tổng số tiền vay, số tiền vay lớn nhất và số lượng hợp đồng theo từng mức lãi suất)?

INTERESTCREDIT_AMOUNT_SUMCREDIT_AMOUNT_MAXAccs
0,11620000080000512
0,13300000050000148
0,15400000030000212
0,17325000060000303

Câu hỏi 6: Câu lệnh truy vấn nào trả về độ tuổi trung bình của những khách hàng có khoản vay?

A. select avg((sysdate-p.date_birth)/365.25) from view_person p

B. select avg((sysdate-p.date_birth)/365.25) from view_person p where p.id_person in (select id_person from view_credit c)

C. select avg((sysdate-p.date_birth)/365) from view_person p left join view_credit c on p.id_person = c.id_person

D. select avg((sysdate-p.date_birth)/365) from view_person p

Câu hỏi 7: Câu lệnh truy vấn nào trả về số lượng con trung bình của tất cả khách hàng?

A. select avg(p.child_num) from view_person p

B. select avg(p.child_num) from view_person p where p.id_person in (select id_person from view_credit c)

C. select sum(p.child_num)/count(*) from view_person p where p.id_person in (select id_person from view_credit c)

D. select avg(p.child_num) from view_person p where p.id_person in (select id_person from view_credit c where c.id_person=p.id_person)

PHẦN II: KIỂM TRA LOGIC (LOGICAL TEST)

Câu hỏi 1: Bài toán về lương

Có 6 nhân viên trong một công ty. Hai người trong số họ có mức lương là 11.000 USD một năm. Một người nhận được mức lương 8.000 USD một năm. Những người còn lại nhận được mức lương 14.000 USD một năm.

Yêu cầu: Chi phí lương trung bình hàng tháng cho một nhân viên trong công ty này là bao nhiêu? Giải thích tại sao?

Câu hỏi 2: Suy luận mệnh đề (Tam đoạn luận)

Mệnh đề 1: Tất cả hoa đều là mèo.

Mệnh đề 2: Tất cả quạt đều là mèo.

Kết luận:
I. Tất cả hoa là quạt.
II. Một số quạt là hoa.

Lựa chọn đáp án:
A. Chỉ kết luận I đúng.
B. Chỉ kết luận II đúng.
C. Hoặc kết luận I đúng hoặc kết luận II đúng.
D. Không có kết luận nào đúng.
E. Cả hai kết luận I và II đều đúng.

Câu hỏi 3: Số trung bình và Số trung vị

Giả sử có hai nhóm: 10 nam (tuổi trung bình là 25) và 10 nữ (tuổi trung bình là 20). Trong các nhóm này có các cặp song sinh nam và nữ.

Kết luận 1: Số trung vị về độ tuổi của nhóm nam lớn hơn số trung vị về độ tuổi của nhóm nữ. (Đúng hay Sai?)

Kết luận 2: Nếu chúng ta sắp xếp cả hai nhóm theo độ tuổi và tạo thành 10 cặp (ví dụ: nam trẻ nhất đi kèm với nữ trẻ nhất, và tiếp tục như vậy), sẽ có ít nhất 5 cặp trở lên mà người nam lớn tuổi hơn hoặc bằng tuổi người nữ. (Đúng hay Sai?)

Kết luận 3: Các nhóm có thể được sắp xếp lại bằng cách di chuyển người từ nhóm này sang nhóm khác sao cho độ tuổi trung bình ở cả hai nhóm đều tăng lên. (Đúng hay Sai?)

PHẦN III: KIỂM TRA PHÂN TÍCH (ANALYST TEST)

Phân tích 1: Xu hướng sản lượng (Volume Trends)

Dựa trên bảng dữ liệu về sản lượng của Điện thoại thông minh (Smartphone), Xe máy (Motorbike) và Tiền mặt (Cash) giai đoạn 2019-2020:

THÁNGSản lượng SmartphoneSản lượng Xe máySản lượng Tiền mặt
2020-0912.49140.36523.283
2020-0810.49332.78522.536
2020-079.49927.58523.213
2020-068.94026.11323.551
2020-0513.04530.20319.335
2020-049.62423.14218.594
2020-0314.13835.74928.229
2020-0214.69741.24926.363
2020-0126.08592.25824.109
2019-1217.57664.36730.586
2019-1114.15054.11429.249
2019-1013.56553.70829.531
2019-0914.36069.60932.572
2019-088.39526.22823.003

Các câu hỏi yêu cầu giải thích:

  1. Tại sao sản lượng trong tháng 1 lại cao hơn một cách đáng kể so với các tháng khác trong năm?
  2. Tại sao sản lượng Xe máy vào tháng 9 thông thường lại cao hơn so với tháng 8 và tháng 10?
  3. Tại sao xu hướng sản lượng Tiền mặt vào tháng 6 và tháng 7 lại tăng lên trong khi các mảng sản phẩm khác lại có xu hướng giảm xuống?

Phân tích 2: Đánh giá hiệu suất của các Nhóm trưởng (Team Leaders)

Dưới đây là bảng dữ liệu về Tỷ lệ đạt mục tiêu (Target Achievement) cho sản phẩm Vay tiền mặt của các Nhóm trưởng trong 13 tháng vừa qua:

TÊN NHÓM20-1020-1120-1221-0121-0221-0321-0421-0521-0621-0721-0821-0921-10
Internal1⚠️ 91%⚠️ 99%🟢 103%⚠️ 96%🟢 114%🟢 107%⚠️ 88%🟢 103%⚠️ 99%⚠️ 91%♦️ 74%🟢 124%🟢 104%
Internal10🟢 101%🟢 100%🟢 102%⚠️ 100%⚠️ 98%🟢 101%⚠️ 83%⚠️ 96%⚠️ 84%⚠️ 82%♦️ 77%🟢 122%🟢 105%
Internal12⚠️ 95%🟢 107%🟢 112%🟢 115%🟢 112%🟢 107%⚠️ 91%🟢 119%🟢 108%🟢 103%⚠️ 93%🟢 133%🟢 109%
Internal15⚠️ 99%⚠️ 94%⚠️ 99%🟢 105%🟢 108%⚠️ 96%⚠️ 82%🟢 110%⚠️ 94%⚠️ 93%⚠️ 88%🟢 131%🟢 100%
Internal16🟢 102%🟢 107%🟢 112%🟢 103%🟢 106%⚠️ 95%⚠️ 94%🟢 110%⚠️ 99%🟢 101%⚠️ 99%🟢 141%🟢 120%
Internal17⚠️ 89%🟢 106%🟢 105%⚠️ 99%🟢 104%⚠️ 88%⚠️ 81%🟢 107%⚠️ 94%⚠️ 89%♦️ 78%🟢 121%⚠️ 97%
Internal18⚠️ 97%🟢 102%🟢 104%⚠️ 94%⚠️ 95%⚠️ 85%⚠️ 94%🟢 106%⚠️ 95%⚠️ 88%♦️ 74%🟢 148%🟢 113%
Internal2⚠️ 92%🟢 107%🟢 109%🟢 103%🟢 107%⚠️ 99%⚠️ 95%🟢 108%⚠️ 99%⚠️ 95%⚠️ 93%🟢 134%🟢 108%
Internal21⚠️ 88%⚠️ 85%⚠️ 83%⚠️ 96%⚠️ 93%⚠️ 85%♦️ 73%🟢 126%⚠️ 95%
Internal22⚠️ 81%⚠️ 99%⚠️ 90%⚠️ 99%⚠️ 94%⚠️ 91%⚠️ 84%🟢 102%⚠️ 92%⚠️ 87%♦️ 78%🟢 117%⚠️ 98%
Internal3🟢 106%🟢 113%🟢 109%⚠️ 98%🟢 110%🟢 100%⚠️ 96%🟢 104%🟢 102%⚠️ 81%♦️ 70%🟢 129%🟢 107%
Internal5🟢 101%🟢 106%🟢 116%🟢 106%🟢 107%🟢 101%⚠️ 97%🟢 114%🟢 110%🟢 105%⚠️ 81%🟢 126%🟢 109%
Internal7⚠️ 90%♦️ 73%⚠️ 96%⚠️ 89%⚠️ 85%♦️ 70%🟢 107%⚠️ 92%
Internal8🟢 111%🟢 109%🟢 105%🟢 110%⚠️ 96%⚠️ 91%🟢 113%⚠️ 93%⚠️ 97%⚠️ 87%🟢 137%⚠️ 96%
Internal9⚠️ 98%🟢 111%🟢 110%⚠️ 98%⚠️ 97%⚠️ 92%⚠️ 84%⚠️ 97%⚠️ 91%⚠️ 89%♦️ 75%🟢 124%⚠️ 99%
Tổng cộng96%105%106%102%104%96%88%105%96%91%81%128%104%

Câu hỏi:

  1. Theo quan điểm cá nhân của bạn, ai là Nhóm trưởng làm việc tốt nhất và ai là Nhóm trưởng làm việc kém nhất? Hãy giải thích lý do tại sao?
  2. Có kết quả nào trong bảng dữ liệu trên được coi là bất thường (unusual) không? Hãy giải thích lý do tại sao?

Tạm kết

Trong quá trình làm bài, nếu bạn có bất kỳ thắc mắc nào về cách tiếp cận, hướng giải hoặc kiến thức liên quan, bạn có thể để lại bình luận trực tiếp dưới bài viết để được hỗ trợ.

Ngoài ra, bạn cũng có thể nhắn tin qua fanpage chính thức của học viện tại:
👉 Facebook: https://www.facebook.com/daotaoDE

Đội ngũ INDA Academy sẽ hỗ trợ giải đáp và định hướng cách học phù hợp trong thời gian sớm nhất.

INDA Academy tự hào là đơn vị tiên phong trong việc đào tạo phân tích dữ liệu và AI chuyên sâu, đặc biệt cho khối ngành Ngân hàng – Tài chính – Bảo hiểm tại Việt Nam. Sau hơn 12 năm “thực chiến” cùng những dòng chảy dữ liệu khổng lồ, chúng tôi đã xây dựng nên một hệ sinh thái đào tạo toàn diện, giúp hàng nghìn học viên chuyển mình từ người mới bắt đầu trở thành những chuyên gia lành nghề, sẵn sàng đáp ứng tiêu chuẩn khắt khe của các doanh nghiệp lớn.

Điểm khác biệt lớn nhất tại INDA chính là triết lý đào tạo dựa trên các dự án thực tế (Project-based) và lộ trình cá nhân hóa nhờ ứng dụng AI. Chúng tôi không chỉ dạy bạn cách sử dụng công cụ, mà còn truyền tải tư duy khai phá giá trị từ dữ liệu để đưa ra quyết định kinh doanh chính xác.

Tìm hiểu thêm về các khóa học TẠI ĐÂY:
Lộ trình đào tạo Data Analyst

Khóa học Data Analyst nâng cao – Thực chiến 5 dự án doanh nghiệp

    Leave a Reply

    Your email address will not be published. Required fields are marked *