AI đã có thể đưa ra dự báo tài chính chuẩn xác hơn con người?
Theo trang Business Insider, một nghiên cứu mới đây đã chỉ ra khả năng ấn tượng của trợ lý AI GPT-4 đến từ OpenAI trong lĩnh vực phân tích tài chính.
Những phát hiện này có thể làm thay đổi ngành dịch vụ tài chính, ngành đang gấp rút áp dụng các công nghệ AI tạo sinh như các ngành kinh doanh khác.
Theo nghiên cứu do Trường Kinh doanh Booth của Đại học Chicago thực hiện, mô hình ngôn ngữ GPT-4 đã thực hiện việc phân tích báo cáo tài chính và đưa ra các dự đoán dựa trên những báo cáo đó. Đáng chú ý, kết quả cho ra thậm chí còn tốt hơn các chuyên gia con người.
"Ngoài việc không cần bất kỳ thông tin cụ thể nào về ngành hay bối cảnh, mô hình ngôn ngữ lớn (LLM) vẫn vượt trội hơn các nhà phân tích tài chính về khả năng dự đoán thay đổi thu nhập," nghiên cứu cho biết. "LLM thể hiện ưu thế tương đối lớn so với các nhà phân tích con người trong những tình huống mà các nhà phân tích thường gặp khó khăn."
Nghiên cứu đã sử dụng các hướng dẫn "chuỗi tư duy" để chỉ đạo GPT-4 nhận diện các xu hướng trong báo cáo tài chính và tính toán các tỷ lệ tài chính khác nhau. Từ đó, mô hình ngôn ngữ lớn này đã phân tích thông tin và dự đoán kết quả thu nhập trong tương lai.
"Khi chúng tôi sử dụng chuỗi tư duy để mô phỏng lý luận của con người, chúng tôi thấy rằng GPT đạt độ chính xác 60%, cao hơn đáng kể so với các nhà phân tích," nghiên cứu cho biết. Độ chính xác của các nhà phân tích con người thường chỉ ở mức khoảng 50%.
Khả năng của các mô hình ngôn ngữ lớn trong việc nhận ra các mẫu tài chính và khái niệm kinh doanh với thông tin không đầy đủ gợi ý rằng công nghệ này có thể đóng vai trò quan trọng trong việc ra quyết định tài chính trong tương lai, theo các tác giả của nghiên cứu.
Cuối cùng, nghiên cứu cho thấy việc áp dụng kiến thức tài chính của GPT-4 vào các chiến lược kinh doanh sẽ tạo ra giao dịch có lợi nhuận cao hơn.
Bước tiến lớn của OpenAI
Hồi cuối năm 2023, dựa trên hồ sơ các công ty đại chúng của Uỷ ban Chứng khoán và Giao dịch Mỹ (SEC), Patronus AI - startup chuyên đánh giá sức mạnh của các mô hình ngôn ngữ lớn (LLM), đã xây dựng bộ dữ liệu gồm hơn 10.000 câu hỏi và câu trả lời liên quan. Một số câu hỏi yêu cầu AI phải trích xuất dữ liệu, tính toán và suy luận đơn giản.
Nghiên cứu đã sử dụng bốn mô hình LLM mạnh nhất hiện nay như GPT-4 và GPT-4-Turbo của OpenAI, Claude 2 của Anthropic và Llama 2 của Meta, thực hiện bài test 150 câu hỏi trích từ bộ dữ liệu nói trên.
Kết quả cho thấy, không mô hình nào thể hiện được sức mạnh xử lý phân tích như kỳ vọng. Trong đó, phiên bản mạnh nhất của OpenAI, GPT-4-Turbo có tới 88% trả lời sai trong chế độ không truy cập dữ liệu, và chỉ đạt tỷ lệ chính xác 85% khi được trợ lý con người trỏ chuột đến đoạn văn bản cụ thể để tìm câu trả lời.
Như vậy, với kết quả hiện tại, có thể thấy OpenAI đã tiến một bước lớn trong việc giúp mô hình ngôn ngữ của mình trở nên toàn diện hơn.