Skip to content

andrewcaoo/Processing_data_by_local_hadoop_and_spark

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

I) Xử lý dữ liệu có cấu trúc. Dự án sẽ lấy các file dữ liệu có cấu trúc từ hai website:

II) Xử lý dữ liệu không cấu trúc.

Lấy dữ liệu không có cấu trúc từ các email vị dụ. Email này được tạo ra nhờ việc hỏi ChatGPT. Sau khi load các email và Rdd. Ta sẽ thực hiện đếm số từ của email, lấy ra tên người nhận và đánh giá thái độ của email. Đưa các thông tin trên cùng với tên email vào 1 dataframe và load thành table trong PostgresQl database.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published