Big data là gì? Những nguồn chính tạo ra Big Data

Big data là gì? Big Data là thuật ngữ dùng để chỉ một tập hợp dữ liệu rất lớn và phức tạp mà những công cụ xử lí dữ liệu truyền thống không đảm đương nổi.

Big Data là gì

Big Data là những thông tin có tốc độ cao, khối lượng dữ liệu lớn và đa dạng, đòi hỏi phải có những công nghệ hiện đại và mới nhất mới có thể xử lý hiệu quả

Giúp đưa ra những quyết định hiệu quả, tối ưa được quá trình xử lý và khám phá các yếu tố ẩn sâu trong dữ liệu.

Thuật ngữ này chỉ một tập hợp các dữ liệu với số lượng quá lớn mà các kỹ thuật điện toán thông thường không thể xử lý được.

Ngoài ra, Big Data còn chỉ các công cụ, công nghệ và các cơ cấu tổ chức dữ liệu liên quan.

Big data là một tập hợp các dữ liệu khổng lồ 

Big data là một tập hợp các dữ liệu khổng lồ

Ngày này, với sự tiến bộ vượt bậc của công nghệ cùng với đó là nhiều kênh truyền thông mới ra đời như các thiết bị công nghệ và mạng xã hội đã đặt ra thách thức không nhỏ cho các nền công nghiệp trong việc tìm ra các xử lý dữ liệu khổng lồ đó.

Từ khi hình thành cho đến hết năm 2003, dữ liệu trên toàn thế giới chỉ đạt con số 5 tỷ gigabyte, nhưng đến năm 2011, thì chỉ cần 2 ngày để đạt được con số đó.

Và con số dữ liệu này chỉ cần 10 phút là đủ để tạo ra trong năm 2013, một con số khủng khiếp.

Những nguồn chính tạo ra Big Data

  • Dữ liệu các thiết bị tìm kiếm: Đây là nguồn dữ liệu lớn nhất của big data được tạo ra từ các công cụ tìm kiếm trên thế giới
  • Dữ liệu giao thông: dữ liệu này bao gồm các mẫu phương tiện giao thông, khoảng cách đã đi , sức chứa…..của từng phương tiện
  • Dữ liệu điện lực: đây là dữ liệu được tạo ra bởi điện lực, gồm các thông tin cụ thể từ các điểm giao nhau giữa các nút thông tin.
  • Dữ liệu giao dịch chứng khoán: đây là những số liệu sinh ra từ thị trường chứng khoán được thực hiện bởi các khách hàng
  • Dữ liệu từ các kênh truyền thông xã hội: đây là dữ liệu được tạo ra từ các trang web xã hội như Google+, Instagram, Pinterest, Facebook, Twitter.
  • Hộp đen dữ liệu : đây là dữ liệu được tạo ra bởi tất cả các loại máy bay bao gồm các bản thu âm, thông tin chuyến bay, thông tin được tạo ra bởi giọng nói của phi hành đoàn.

Rất nhiều nguồn dữ liệu khác nhau đã tạo nên big data 

Rất nhiều nguồn dữ liệu khác nhau đã tạo nên big data

Ngoài ra, theo như 1 chuyên gia về phân tích big data đã chia sẻ 1 danh sách gồm 20 nguồn big data uy tín và hoàn toàn miễn phí mà người dùng có thể truy cập  trên internet như:

  • Data.gov :Có thể truy cập tất cả dữ liệu về các thông tin khác nhau của chính phủ mỹ
  • Data.gov.uk : cũng giống như trên, nhưng thuộc chính phủ Anh, gồm các thông tin như địa lí, dân số hay các dữ liệu khác
  • Ngoài ra còn có kho dữ liệu của Liên Minh Châu Âu(các thông tin về điều tra dân số…) Bộ dữ liệu công cộng Amazon Web Services, Google Finance, Google Trends
  • Trong lĩnh vực y tế, đó là xã hội NHS, từ Anh, Healthdata.gov của Mỹ và Trung tâm Thông tin chăm sóc Y tế .
  • Và còn có cả big data của mạng xã hội facebook, những biểu đồ về các thông tin công khai được cung cấp bởi người dùng và giao diện của ứng dụng

Hy vọng bài viết trên đã giúp bạn có cái nhìn tổng quan hơn để phần nào hiểu được Big data là gì.

Cám ơn các bạn đã theo dõi bài viết của chúng tôi, nếu thấy hay thì hãy chia sẽ để động viên chúng tôi tiếp tục nhé.

Post Comment