Mô hình chiến lược sinh nội dung truyền thông phân tích chuyên sâu ứng dụng truy xuất thông tin tăng cường liên tục
DOI:
https://doi.org/10.54939/1859-1043.j.mst.208.2025.136-142Từ khóa:
Tạo sinh dữ liệu truyền thông mạng xã hội; Mô hình ngôn ngữ lớn; Tạo sinh truy xuất tăng cường; Nghiên cứu sâu; AI cho các vấn đề công cộng.Tóm tắt
Truyền thông mạng xã hội đã trở thành một lĩnh vực quan trọng cho giao tiếp chiến lược, có ảnh hưởng đến nhận thức của công chúng và hỗ trợ các hoạt động cả dân sự lẫn quân sự. Trong các môi trường thông tin có nhịp độ cao, việc tạo nội dung thủ công truyền thống thường quá chậm và tốn nhiều tài nguyên để đáp ứng nhu cầu tương tác theo thời gian thực. Trong khi các mô hình ngôn ngữ lớn (LLM) như GPT-4 có khả năng tạo văn bản giống con người trên quy mô lớn, việc chúng phụ thuộc vào dữ liệu huấn luyện tĩnh đã hạn chế tính phù hợp theo ngữ cảnh, mức độ xác thực thông tin bị nghi ngờ và không có khả năng tùy biến với các nhiệm vụ đa dạng. Để khắc phục những hạn chế này, bài báo này giới thiệu Social-DeepWriter, một khung làm việc hỗ trợ bởi AI để tự động tạo nội dung truyền thông xã hội phù hợp với nhiệm vụ. Được xây dựng dựa trên mô hình "Nghiên cứu Sâu" (Deep Research paradigm), Social-DeepWriter cải thiện Mô hình Tạo sinh tăng cường truy xuất (RAG) truyền thống bằng cách tích hợp tinh chỉnh truy vấn lặp đi lặp lại, truy xuất đa bước và đánh giá nội dung, phản ánh quá trình lập luận nhiều tầng của các nhà phân tích con người. Chúng tôi đánh giá các yếu tố như chất lượng truy xuất, thiết kế câu lệnh và các ràng buộc khi tạo nội dung ảnh hưởng như thế nào đến tính cung cấp thông tin, sự mạch lạc và mức độ phù hợp về mặt chiến lược của các bài đăng được tạo ra. Kết quả của chúng tôi nhấn mạnh tiềm năng của Social-DeepWriter trong việc hỗ trợ các kịch bản giao tiếp lưỡng dụng và các chiến dịch phản ứng nhanh, nơi mà độ chính xác, khả năng thích ứng và khả năng mở rộng là yếu tố thiết yếu.
Tài liệu tham khảo
[1]. Starbird, K. and T. Wilson, “Disinformation as collaborative work: Surfacing the participatory nature of strategic information operations”, Proceedings of the ACM on Human-Computer Interaction, 4, CSCW2, 1–26, (2020).
[2]. OpenAI, “GPT-4 Technical Report”, Technical Report, (2023).
[3]. Ji, Z., N. Lee, R. Frieske, T. Yu, D. Su, Y. Xu, and P. Fung, “Survey of hallucination in natural language generation”, ACM Computing Surveys, 55, 12, 1–38, (2023).
[4]. Lewis, P., E. Perez, A. Piktus, F. Petroni, V. Karpukhin, N. Goyal, and S. Riedel, “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”, Advances in Neural Information Processing Systems, 33, 9459–9474, (2020).
[5]. Wu, J., J. Zhu, and Y. Liu, “Agentic reasoning: Reasoning LLMs with tools for deep research”, arXiv preprint arXiv:2502.04644, (2025).
[6]. Ammann, P. J., J. Golde, and A. Akbik, “Question decomposition for retrieval-augmented generation”, arXiv preprint arXiv:2507.00355, (2025).
[7]. Ma, X., Y. Gong, P. He, H. Zhao, and N. Duan, “Query rewriting in retrieval-augmented large language models”, Proceedings of the Conference on Empirical Methods in Natural Language Processing, 5303–5315, (2023).
[8]. Nguyen, L. T. D., N. D. Nguyen, and K. H. N. Bui, “An embedding method for sentiment classification across multiple languages”, Proceedings of the International Conference on Knowledge and Systems Engineering, 1–6, (2021).
[9]. Phan, T. A., N. D. N. Nguyen, and K. H. N. Bui, “HeterGraphLongSum: Heterogeneous graph neural network with passage aggregation for extractive long document summarization”, Proceedings of the International Conference on Computational Linguistics, 6248–6258, (2022).
[10]. Liang, X., Y. He, Y. Xia, X. Song, J. Wang, M. Tao, and T. Shi, “Self-evolving agents with reflective and memory-augmented abilities”, arXiv preprint arXiv:2409.00872, (2024).
[11]. Yao, S., J. Zhao, D. Yu, N. Du, I. Shafran, K. Narasimhan, and Y. Cao, “ReAct: Synergizing reasoning and acting in language models”, International Conference on Learning Representations, (2023).
