Mobile Area

Dữ liệu có là vấn đề phát triển của Việt Nam?

Thứ Bảy,  7/3/2020, 16:59 
Võ Đình Trí

Dữ liệu có là vấn đề phát triển của Việt Nam?

Võ Đình Trí

(TBKTSG) - Khi dịch Covid-19 bùng phát, các tổ chức quốc tế, chính phủ và doanh nghiệp đều muốn biết những kịch bản nào có thể xảy ra nhằm tìm giải pháp thích ứng. Đây là lúc vai trò của các mô hình ước lượng, dự báo có độ tin cậy cao phát huy vai trò của mình.

Nhưng chỉ có mô hình tốt thôi thì cũng không đủ, vì đầu vào của các mô hình là dữ liệu, nên chất lượng và số lượng dữ liệu quyết định không nhỏ đến kết quả ước lượng, dự báo.

Cho đến nay, trở ngại lớn nhất đối với những ai làm phân tích, mô phỏng, dự báo về kinh tế Việt Nam có lẽ vẫn là vấn đề dữ liệu. Mặc dù Tổng cục Thống kê đã có nhiều nỗ lực nhưng độ mở (công chúng có thể tiếp cận), chất lượng, và số lượng của các bộ dữ liệu vẫn còn rất nhiều hạn chế. Hệ lụy là mặc dù có các mô hình tốt, đã được kiểm chứng, nhưng do dữ liệu đầu vào không chuẩn (bị thiếu, bị sai do nhập liệu hay thu thập), không đủ số lượng quan sát, thì kết quả sẽ bị sai lệch (biased). Kéo theo đó sẽ là các nhận định phân tích không chính xác, rồi dẫn đến các chính sách ban hành không phải là dựa trên dữ liệu, bằng chứng, mà sẽ dựa trên cảm tính.

Nhưng vấn đề dữ liệu còn ảnh hưởng đến cả sự phát triển của một nền kinh tế trong điều kiện bình thường. Trong một nghiên cứu mới đây (Aaronson, 2019), tác giả trích dẫn lại nhận định của nhà khoa học chính trị nổi tiếng Steven Weber rằng ở nhiều nước đang phát triển, dữ liệu có rất nhiều và rẻ nhưng phụ thuộc vào hạ tầng và lao động có trình độ cao - là những thứ rất đắt. Kết quả nghiên cứu từ 42 quốc gia cho thấy trong số những nước đang phát triển, những nước có xu hướng dữ liệu “mở”, khuyến khích doanh nghiệp và người dân sử dụng các nguồn dữ liệu, và có chính sách bảo vệ dữ liệu cá nhân tốt đều là những nước có thu nhập bình quân đầu người cao hơn.

Nền kinh tế số phải bắt đầu với dữ liệu. Chúng ta chắc hẳn không thiếu dữ liệu thô, nhưng cần sắp xếp, phân loại để dữ liệu trở nên hữu ích, được sử dụng và tạo ra dữ liệu mới. Chính sách cần hướng đến khuyến khích dữ liệu mở, bảo vệ thông tin cá nhân, và phát triển nhân lực có trình độ cao để khai thác hiệu quả nguồn tài nguyên dữ liệu.

Vấn đề đối với nhiều nước đang phát triển là giới lãnh đạo và những người hoạch định chính sách chưa nhận thức đúng về dữ liệu. Thứ nhất, họ chưa xem dữ liệu là một dạng tài nguyên để phát triển nên chưa chú trọng đến hạ tầng và đội ngũ nhân lực có trình độ cao để khai thác. Thứ hai, họ vẫn muốn độc quyền lưu trữ và khai thác dữ liệu khi chưa đủ nhận thức hay khả năng chia sẻ dữ liệu để gia tăng hiệu quả sử dụng dữ liệu cả về kinh tế lẫn chính trị.

Với Việt Nam, câu chuyện dữ liệu cho sự phát triển dường như còn phức tạp hơn: dữ liệu thiếu và chất lượng còn là một câu hỏi lớn, dữ liệu nếu có thì độ mở còn nhiều hạn chế, và việc bảo vệ dữ liệu cá nhân có một khoảng cách quá xa giữa thực tế và chính sách. Có nhiều minh chứng cho các vấn đề này, người viết chỉ xin đề cập đến một số lĩnh vực mà nếu làm tốt hơn, dữ liệu sẽ đóng góp nhiều cho sự phát triển:

Thứ nhất là dữ liệu về thị trường nông nghiệp. Đã nhiều lần, cả nước rộ lên việc giải cứu nông sản hay thủy, hải sản vì cung vượt xa cầu, được mùa mất giá. Trách người dân không tìm hiểu cung - cầu thị trường trước khi bắt tay vào sản xuất cũng đúng, vì cần biết nhu cầu - giá cả trong nước và thế giới về sản phẩm hiện nay và sắp tới ra sao, nguồn cung - giá cả trong nước và thế giới như thế nào, có bao nhiêu người đang làm như mình rồi. Nhưng với những người cần biết những thông tin này, thì lại không biết tìm ở đâu.

Thứ hai là dữ liệu về thị trường lao động việc làm. Chính vì thiếu dữ liệu, dự báo về thị trường lao động nên có những ngành, những lĩnh vực dư thừa lao động trong khi những ngành khác lại thiếu. Đánh giá nhu cầu thị trường lao động không chính xác kéo theo đầu tư cho nguồn cung từ đào tạo cũng không được tối ưu, tạo ra nhiều lãng phí cho xã hội.

Thứ ba là dữ liệu về dân số học, để doanh nghiệp dựa vào đó phát triển sản phẩm, dịch vụ mới hay cải tiến sản phẩm, dịch vụ của mình. Đơn giản như để làm một nghiên cứu thị trường, nếu nhiều dữ liệu không có hoặc không “mở” thì chi phí sẽ gia tăng đáng kể, trong khi đó, nếu dữ liệu có sẵn và được tiếp cận dễ dàng thì chi phí sẽ được phân bổ đến mức tối thiểu.

Thứ tư là dữ liệu về kinh tế - xã hội phục vụ cho nghiên cứu và hoạch định chính sách. Có rất nhiều nghiên cứu về Việt Nam gặp trở ngại với vấn đề dữ liệu, cả sự tồn tại lẫn khả năng tiếp cận. Trong khi đó, việc hoạch định chính sách còn chưa chú trọng đến sử dụng dữ liệu hay bằng chứng thực nghiệm. Có rất nhiều chính sách khi ban hành, có mục tiêu rất rõ ràng nhưng đằng sau đó, không có cơ sở vững chắc cho việc tại sao là x% mà không là y%.

Cuối cùng, việc bảo vệ dữ liệu cá nhân dường như chưa được quan tâm đúng mức. Nhiều vụ rò rỉ thông tin khách hàng hay dữ liệu khách hàng được rao bán công khai nhưng trách nhiệm của nơi sở hữu và bị rò rỉ chưa được đề cập đến. Ngoài ra, xác định thẩm quyền của cơ quan nhà nước trong việc tiếp cận dữ liệu cá nhân cũng là vấn đề, để tránh trường hợp lạm quyền.

Việt Nam gần đây đã chú trọng đến nền kinh tế số hóa, và có lẽ chuyển đổi số sẽ là một trong những ưu tiên hàng đầu. Nhưng nền kinh tế số phải bắt đầu với dữ liệu. Chúng ta chắc hẳn không thiếu dữ liệu thô, nhưng cần sắp xếp, phân loại để dữ liệu trở nên hữu ích, được sử dụng và tạo ra dữ liệu mới. Chính sách cần hướng đến khuyến khích dữ liệu mở, bảo vệ thông tin cá nhân, và phát triển nhân lực có trình độ cao để khai thác hiệu quả nguồn tài nguyên dữ liệu.

In bài
Gửi bài cho bạn bè
CÙNG CHUYÊN MỤC
Trả giá đắt cho sự mất cảnh giác
Cần có một tờ báo ngày về kinh tế
Thư ký công ty không phải người để sai vặt
Biên chế và hộ khẩu, câu chuyện ở xứ Tây và quê ta
Đổi biển số vàng: đẩy khó cho chủ xe
Dữ liệu có là vấn đề phát triển của Việt Nam?
Võ Đình Trí
Thứ Bảy,  7/3/2020, 16:59 

Dữ liệu có là vấn đề phát triển của Việt Nam?

Võ Đình Trí

(TBKTSG) - Khi dịch Covid-19 bùng phát, các tổ chức quốc tế, chính phủ và doanh nghiệp đều muốn biết những kịch bản nào có thể xảy ra nhằm tìm giải pháp thích ứng. Đây là lúc vai trò của các mô hình ước lượng, dự báo có độ tin cậy cao phát huy vai trò của mình.

Nhưng chỉ có mô hình tốt thôi thì cũng không đủ, vì đầu vào của các mô hình là dữ liệu, nên chất lượng và số lượng dữ liệu quyết định không nhỏ đến kết quả ước lượng, dự báo.

Cho đến nay, trở ngại lớn nhất đối với những ai làm phân tích, mô phỏng, dự báo về kinh tế Việt Nam có lẽ vẫn là vấn đề dữ liệu. Mặc dù Tổng cục Thống kê đã có nhiều nỗ lực nhưng độ mở (công chúng có thể tiếp cận), chất lượng, và số lượng của các bộ dữ liệu vẫn còn rất nhiều hạn chế. Hệ lụy là mặc dù có các mô hình tốt, đã được kiểm chứng, nhưng do dữ liệu đầu vào không chuẩn (bị thiếu, bị sai do nhập liệu hay thu thập), không đủ số lượng quan sát, thì kết quả sẽ bị sai lệch (biased). Kéo theo đó sẽ là các nhận định phân tích không chính xác, rồi dẫn đến các chính sách ban hành không phải là dựa trên dữ liệu, bằng chứng, mà sẽ dựa trên cảm tính.

Nhưng vấn đề dữ liệu còn ảnh hưởng đến cả sự phát triển của một nền kinh tế trong điều kiện bình thường. Trong một nghiên cứu mới đây (Aaronson, 2019), tác giả trích dẫn lại nhận định của nhà khoa học chính trị nổi tiếng Steven Weber rằng ở nhiều nước đang phát triển, dữ liệu có rất nhiều và rẻ nhưng phụ thuộc vào hạ tầng và lao động có trình độ cao - là những thứ rất đắt. Kết quả nghiên cứu từ 42 quốc gia cho thấy trong số những nước đang phát triển, những nước có xu hướng dữ liệu “mở”, khuyến khích doanh nghiệp và người dân sử dụng các nguồn dữ liệu, và có chính sách bảo vệ dữ liệu cá nhân tốt đều là những nước có thu nhập bình quân đầu người cao hơn.

Nền kinh tế số phải bắt đầu với dữ liệu. Chúng ta chắc hẳn không thiếu dữ liệu thô, nhưng cần sắp xếp, phân loại để dữ liệu trở nên hữu ích, được sử dụng và tạo ra dữ liệu mới. Chính sách cần hướng đến khuyến khích dữ liệu mở, bảo vệ thông tin cá nhân, và phát triển nhân lực có trình độ cao để khai thác hiệu quả nguồn tài nguyên dữ liệu.

Vấn đề đối với nhiều nước đang phát triển là giới lãnh đạo và những người hoạch định chính sách chưa nhận thức đúng về dữ liệu. Thứ nhất, họ chưa xem dữ liệu là một dạng tài nguyên để phát triển nên chưa chú trọng đến hạ tầng và đội ngũ nhân lực có trình độ cao để khai thác. Thứ hai, họ vẫn muốn độc quyền lưu trữ và khai thác dữ liệu khi chưa đủ nhận thức hay khả năng chia sẻ dữ liệu để gia tăng hiệu quả sử dụng dữ liệu cả về kinh tế lẫn chính trị.

Với Việt Nam, câu chuyện dữ liệu cho sự phát triển dường như còn phức tạp hơn: dữ liệu thiếu và chất lượng còn là một câu hỏi lớn, dữ liệu nếu có thì độ mở còn nhiều hạn chế, và việc bảo vệ dữ liệu cá nhân có một khoảng cách quá xa giữa thực tế và chính sách. Có nhiều minh chứng cho các vấn đề này, người viết chỉ xin đề cập đến một số lĩnh vực mà nếu làm tốt hơn, dữ liệu sẽ đóng góp nhiều cho sự phát triển:

Thứ nhất là dữ liệu về thị trường nông nghiệp. Đã nhiều lần, cả nước rộ lên việc giải cứu nông sản hay thủy, hải sản vì cung vượt xa cầu, được mùa mất giá. Trách người dân không tìm hiểu cung - cầu thị trường trước khi bắt tay vào sản xuất cũng đúng, vì cần biết nhu cầu - giá cả trong nước và thế giới về sản phẩm hiện nay và sắp tới ra sao, nguồn cung - giá cả trong nước và thế giới như thế nào, có bao nhiêu người đang làm như mình rồi. Nhưng với những người cần biết những thông tin này, thì lại không biết tìm ở đâu.

Thứ hai là dữ liệu về thị trường lao động việc làm. Chính vì thiếu dữ liệu, dự báo về thị trường lao động nên có những ngành, những lĩnh vực dư thừa lao động trong khi những ngành khác lại thiếu. Đánh giá nhu cầu thị trường lao động không chính xác kéo theo đầu tư cho nguồn cung từ đào tạo cũng không được tối ưu, tạo ra nhiều lãng phí cho xã hội.

Thứ ba là dữ liệu về dân số học, để doanh nghiệp dựa vào đó phát triển sản phẩm, dịch vụ mới hay cải tiến sản phẩm, dịch vụ của mình. Đơn giản như để làm một nghiên cứu thị trường, nếu nhiều dữ liệu không có hoặc không “mở” thì chi phí sẽ gia tăng đáng kể, trong khi đó, nếu dữ liệu có sẵn và được tiếp cận dễ dàng thì chi phí sẽ được phân bổ đến mức tối thiểu.

Thứ tư là dữ liệu về kinh tế - xã hội phục vụ cho nghiên cứu và hoạch định chính sách. Có rất nhiều nghiên cứu về Việt Nam gặp trở ngại với vấn đề dữ liệu, cả sự tồn tại lẫn khả năng tiếp cận. Trong khi đó, việc hoạch định chính sách còn chưa chú trọng đến sử dụng dữ liệu hay bằng chứng thực nghiệm. Có rất nhiều chính sách khi ban hành, có mục tiêu rất rõ ràng nhưng đằng sau đó, không có cơ sở vững chắc cho việc tại sao là x% mà không là y%.

Cuối cùng, việc bảo vệ dữ liệu cá nhân dường như chưa được quan tâm đúng mức. Nhiều vụ rò rỉ thông tin khách hàng hay dữ liệu khách hàng được rao bán công khai nhưng trách nhiệm của nơi sở hữu và bị rò rỉ chưa được đề cập đến. Ngoài ra, xác định thẩm quyền của cơ quan nhà nước trong việc tiếp cận dữ liệu cá nhân cũng là vấn đề, để tránh trường hợp lạm quyền.

Việt Nam gần đây đã chú trọng đến nền kinh tế số hóa, và có lẽ chuyển đổi số sẽ là một trong những ưu tiên hàng đầu. Nhưng nền kinh tế số phải bắt đầu với dữ liệu. Chúng ta chắc hẳn không thiếu dữ liệu thô, nhưng cần sắp xếp, phân loại để dữ liệu trở nên hữu ích, được sử dụng và tạo ra dữ liệu mới. Chính sách cần hướng đến khuyến khích dữ liệu mở, bảo vệ thông tin cá nhân, và phát triển nhân lực có trình độ cao để khai thác hiệu quả nguồn tài nguyên dữ liệu.

In bài
Gửi bài cho bạn bè
TIN BÀI KHÁC  
Top
 
Giấy phép Báo điện tử số: 2302/GP-BTTTT, cấp ngày 29/11/2012
Tổng biên tập: Trần Minh Hùng.
Phó tổng biên tập phụ trách online: Phan Chiến Thắng.
Thư ký tòa soạn: Hồng Văn; Phó thư ký tòa soạn: Yến Dung, Minh Châu.
Tòa soạn: 35 Nam Kỳ Khởi Nghĩa, Quận 1, TP.HCM. ĐT:(8428)3829 5936; Fax:(8428)3829 4294; Email: online@kinhtesaigon.vn
Thời báo Kinh tế Sài Gòn giữ bản quyền nội dung của trang web thesaigontimes.vn. Không sử dụng lại nội dung trên trang này dưới mọi hình thức, trừ khi được Thời báo Kinh tế Sài Gòn đồng ý bằng văn bản.
Trang ngoài sẽ được mở ra ở cửa sổ mới. Thời báo Kinh tế Sài Gòn Online không chịu trách nhiệm nội dung trang ngoài.
Bản quyền thuộc về SaigonTimesGroup.