ETL là gì?

ETL là tên gọi viết tắt của Extract, Transform với Load. Trong quy trình này, một vẻ ngoài ETL trích xuất dữ liệu từ các hệ thống nguồn RDBMS không giống nhau sau đó thay đổi dữ liệu như vận dụng các thay đổi dữ liệu ( tính toán, nối chuỗi v.v. ) và kế tiếp tải tài liệu vào hệ thống Data Warehouse.ETL là phần nhiều luồng từ bỏ “nguồn” tới ”đích”. Trong quá trình ETL, engine biến hóa sẽ xử trí mọi biến hóa dữ liệu.

Bạn đang xem: Elt là gì

*

Vậy ELT là gì?

ELT là một cách thức khác để tiếp cận công cụ hoạt động dữ liệu. Nuốm vì thay đổi dữ liệu trước khi viết, ELT có thể chấp nhận được “hệ thống đích” chuyển đổi trước. Dữ liệu đầu tiên được xào nấu vào “đích” và sau đó được biến hóa tại đó.ELT thường được thực hiện với các database No-SQL như Hadoop, Data Appliance hoặc Cloud Installation.

*

Sự không giống nhau giữa ETL và ELT

ETL và ELT khác nhau ở phần đa điểm sau:

ETLELT
1.Quy trìnhDữ liệu được thay đổi từ hệ thống staging sau đó được transfer tới Data warehouse DBDữ liệu vẫn tồn tại trong DB của Data warehouse
2.Code UsageĐược thực hiện cho:-Những đổi khác chuyên sâu về tính chất toán-Lượng data nhỏĐược sử dụng cho lượng data khôn cùng lớn
3.Biến thay đổi dữ liệuCác chuyển đổi được thực hiện trong ETL server/stagingCác biến hóa được thực hiện bên trong “hệ thống đích”
4.Thời gian loadDữ liệu thứ nhất được load vào staging tiếp đến mới load vào “đích”. Nên nhiều thời gianDữ liệu được load vào “đích” chỉ 1 lần sau đó mới biến đổi. Nhanh hơn
5.Thời gian đổi thay đổiQuá trình ETL nên cần quá trình “Tranform” hoàn tất. Khi kích cỡ dữ liệu tăng lên, thời gian chuyển đổi cũng tăng theo..Trong quá trình ELT, vận tốc không bao giờ phụ nằm trong vào kích cỡ của dữ liệu.
6.Thời gian bảo trìNhu cầu bảo trì là không hề nhỏ vì rất cần được chọn tài liệu để load với transformNhu cầu gia hạn là vô cùng thấp vì chưng dữ liệu luôn luôn có sẵn
7.Độ phức tạp khi bắt đầuỞ giai đoạn đầu thực hiện rất dễ dàng dàngĐể thực hiện quy trình ELT, rất cần được có những kỹ năng và kiến thức rất sâu về những tools và năng lực chuyên môn
8.Hỗ trợ Data warehouse?Mô hình ETL được áp dụng cho dữ liệu on-premise, quan hệ giới tính và có cấu trúcĐược áp dụng cho hạ tầng cloud hoàn toàn có thể support các nguồn tài liệu có cấu trúc và phi cấu trúc
9.Hỗ trợ Data LakeKhông supportCho phép sử dụng Data Lake với dữ liệu phi cấu trúc
10.Độ phức tạpQuá trình ETL chỉ load những dữ liệu quan trọng, như đã được xác định trước từ thời gian designQuá trình này bao gồm tất cả thừa trình cải tiến và phát triển từ output-backward và load những tài liệu liên quan
11.Chi phíChi giá thành rất cao cho các doanh nghiệp vừa cùng nhỏChi phí đầu vào thấp khi áp dụng các phần mềm online có tác dụng Services Platforms
12.LookupsTrong quá trình ETL, cả 2 bảng Facts cùng Dimensions cần có sẵn vào StagingTất cả tài liệu đều sẽ sở hữu được sẵn vì chưng Extract với Load được tiến hành chỉ trong một hành động
13. AggregationsĐộ tinh vi tăng lên với tài liệu thêm vào vào datasetSức mạnh mẽ của target platform hoàn toàn có thể xử lí một lượng dữ liệu đáng kể 1 cách nhanh chóng
14.Tính toánGhi đè lên trên cột đang có hoặc bắt buộc cắm cờ với đẩy sang trọng “đích”Dễ dàng thêm cột đang được đo lường vào bảng hiện tại có.

Xem thêm: By Ladipage Là Gì - Hướng Dẫn Sử Dụng Ladipage

15.MaturityETL đã được áp dụng trong rộng 2 thập kỷ. Nó gồm bộ tài liệu giỏi và thuận lợi để thực hànhKhái niệm kha khá mới và khá phức hợp để triển khai
16.HardwareHầu hết các tools đều phải có yêu cầu về hardware riêng rẽ biệt, kha khá đắt tiềnChi phí bỏ phần cứng khối hệ thống điện toán đám mây chưa phải là vụ việc to tát
17. Cung ứng dữ liệu mức giá cấu trúcChủ yếu cung ứng dữ liệu quan hệ nam nữ cấu trúcCó cung ứng sẵn cho dữ liệu phi cấu trúc

Tổng quan lại lại:

ETL là viết tắt của Extract, Transform và Load trong những khi ELT là viết tắt của Extract, Load, Transform.Trước tiên, ETL load data vào staging server tiếp nối mới bắt đầu sang “đích” trong khi ELT load thẳng dữ liệu vào thẳng “đích”.Mô hình ETL được áp dụng cho dữ liệu on-premises, dữ liệu có cấu tạo và quan hệ trong khi ELT được sử dụng cho các nguồn tài liệu có cấu trúc và phi kết cấu trên hệ thống đám mây mở rộng.ETL đa số được thực hiện cho một lượng nhỏ dại dữ liệu trong những lúc ELT được áp dụng cho lượng dữ liệu lớn.ETL không hỗ trợ hỗ trợ Lake Data trong khi ELT hỗ trợ hỗ trợ Lake Data.ETL rất dễ thực hiện trong khi ELT yêu ước các kỹ năng thích thích hợp để tiến hành và duy trì.

Tham khảo : https://www.guru99.com/etl-vs-elt.html