Hướng dẫn lưu lại toàn bộ trang web để đọc offline [Tut hay]

Trong quá trình lướt web chắc chắn bạn đã từng bắt gặp những website/ blog có nội dung hay, hấp dẫn rất phù hợp công việc và sở thích học hỏi của bạn rồi đúng không?

Chắc chắn là thế rồi, ví dụ như blog mà bạn đang đọc đây, nội dung quá hấp dẫn đúng không :D.

Đùa vậy thôi, nếu như bạn thích một website nào đó mà không có thời gian đọc hết ngay được, trong khi đó máy tính ở nhà lại không có intenet thì phải làm sao?

Hoặc nghĩ đơn giản như thế này, bạn sợ một ngày nào đó website/blog đó sẽ không còn nữa thì những kiến thức quý báu sẽ biến mất trên Google và bạn sẽ không còn cơ hội để học nữa.

Chính vì thế trong bài viết ngày hôm nay, blogchiasekienthuc.com sẽ hướng dẫn chi tiết cho các bạn cách lưu lại toàn bộ trang web để bạn có thể yên tâm là nó sẽ còn mãi theo bạn.

Có nhiều phần mềm hỗ trợ cho việc này ví dụ như phần mềm WebCopier Pro, MetaProducts Portable Offline Browser, Teleport,…

Nhưng ở bài viết này mình sẽ sử dụng một công cụ mà hầu như máy tính nào cũng có, đó là phần mềm tăng tốc download IDM.

I. Hướng dẫn lưu lại toàn bộ trang web về máy tính

Bên dưới mình đã tổng hợp lại những cách làm đơn giản và hiệu quả nhất. Bạn hãy đọc qua một lượt xem cách nào phù hợp thì áp dụng nhé !

#1. Cách sao lưu một Page bất kỳ

Nếu như bạn thích một trang nào đó thì chỉ việc mở bài viết đó ra và nhấn Ctrl + S => Sau đó nhấn Save để lưu lại là xong.

Cách này áp dụng cho tất cả các trình duyệt web phổ biến hiện nay ví dụ như Google Chrome, FireFox, IE, CocCoc…

luu-toan-bo-trang-web-5

Ngoài ra, bạn có thể sử dụng một tiện ích có tên là Save Page WE. Tiện ích này giúp lưu lại trang web bất kỳ với 1 click.

#2. Cách lưu lại toàn bộ trang web

Trở lại với chủ đề chính của chúng ta, cách lưu lại 1 page thì rất dễ rồi giờ chúng ta sẽ sử dụng phần mềm IDM để lưu lại toàn bộ nội dung của trang web mà chúng ta muốn.

Đầu tiên bạn mở IDM lên, tại thanh menu bạn nhấn vào Tasks => chọn Run site grabber => xuất hiện giao diện như hình bên dưới.

Bước 1: Thiết lập phương pháp tải

+ Tại ô Start page/address bạn nhập website/blog mà bạn muốn tải về. Ví dụ mình sẽ nhập trang https://blogchiasekienthuc.com/

+ Tại phần Project template có các tùy chọn như:

  • Custom Settings: Lựa chọn thiết lập tùy chọn, tức là nếu như bạn lựa chọn phần này thì các bước sau bạn có thể tự thiết lập bằng tay các thông số khác.
  • All pictures of the website: Có nghĩa là chỉ lưu lại toàn bộ hình ảnh trên website/blog đó.
  • Audio files of start page and from one next level: Chỉ lưu lại toàn bộ file âm thanh của trang chủ và trang cấp 1.
  • All video files of the website: Có nghĩa là chỉ lưu lại toàn bộ phần video của website.
  • All files of the website except web pages and images: Tức là sao lưu toàn bộ thành phần của website (video, audio,…) trừ các trang text và hình ảnh ra.
  • The whole website: Lưu lại toàn bộ website (kể cả các trang thứ cấp của nó). Chế độ đầy đủ nhất đồng nghĩa với việc tốn dung lượng lưu trữ nhất 😀
  • Complete start page with all pictures, styles, and scripts for offline browsing: Chỉ sao lưu lại trang chủ.

+ Tại phần Use authorization:

Nếu như website/blog đó yêu cầu đăng nhập thì bạn hãy tích vào ô  “Use authorization” đó và điền thông tin vào nhé. Bạn có thể nhấn vào “Advanced” để tự tìm hiểu thêm một số tính năng có trong đó.

luu-toan-bo-trang-web-1

Bước 2: Thiết lập nơi lưu

+ Tại phần SaveTo sẽ có 3 lựa chọn cho bạn đó là:

  • Every file to a folder according to IDM category of the file: Có nghĩ là IDM sẽ tự động phân loại và lưu lại vào thư mục như chỉ định của IDM, ví dụ IDM thường lưu các file nén vào My Documents\Downloads\Compressed, lưu các file âm thanh vào My Documents\Downloads\Music…
  • All files to the folder associated with the following IDM category: Cũng tương tự như tùy chọn bên trên nhưng bạn có thể thay đổi nơi lưu cho các định dạng file riêng biệt, không cần thiết phải theo chế độ mặc định của IDM.
  • All files to the following folder: Lựa chọn này sẽ lưu tất cả các thành phần của trang web đó vào một thư mục duy nhất, ví dụ như mình sẽ tạo ra một Folder có tên web hay trong ổ E sau đó nhấn vào “Browse..” để trỏ đến thư mục vừa tạo.

Tips: Tích vào tùy chọn Use original relative subfolders thì IDM thì khi tải về IDM sẽ lưu các thư mục con của website/blog theo đúng thứ tự gốc trên máy chủ chứa website đó.

Ngoài ra còn có các tính năng như:

  • Convert the links in downloaded html files to the local files for offline browsing (khuyên dùng): Tích vào lựa chọn này khi duyệt web với chế độ offline được ổn định hơn.
  • Overwrite existing files: Chế độ này sẽ ghi đè lên tập tin hiện có.

Các bạn có thể thiết lập như trong hình dưới đây => sau đó nhấn Next để chuyển sang bước tiếp theo.

luu-toan-bo-trang-web-2

Bước 3: Chọn chế độ phân cấp để sao lưu

Các bạn để ý đến các tùy chọn sau:

  • Explore the whole site: Chức năng này sẽ là mặc định nếu như ở bước 1 bạn chọn chế độ lưu lại là “The whole website” . Tức là hương trình sẽ sao lưu toàn bộ trang chủ (cấp 0), và các trang thứ cấp (cấp 1, 2… n).
  • Explore the specified number of link levels: Chế độ này để xác định chương trình chỉ lưu lại đến một cấp độ nào đó rồi ngừng lại. Bạn nhập số cấp độ mà mình muốn sao lưu kể từ sau trang chủ (start page) trong ô … levels within the base site (thông thường là 2 hoặc 3). Tiếp theo bạn hãy nhập cấp độ các trang thứ cấp của các website khác có link hiện diện trong trang bạn muốn lưu trong ô … levels on other sites, mình khuyến khích các bạn để là 0 để tránh mất thời gian, vì bạn có thể cũng chẳng quan tâm đến nội dung của các trang này, mà chúng ta hãy tập trung vào trang web bạn đang quan tâm.
  • Ignore popup windows (khuyên dùng): Có nghĩa là khi lựa chọn tính năng này thì khi tải về IDM sẽ không lưu lại popup quảng cáo (nếu có).
  • Explore all sites within the main Domain: Lựa chọn này cho phép bạn lưu lại toàn bộ các trang web có cùng tên miền với trang web bạn muốn sao lưu (trong trường hợp link của các trang web này có hiện diện). Ví dụ trang web bạn muốn sao lưu là https://blogchiasekienthuc.com thì IDM sẽ lưu lại cả các trang web có tên miền .com nếu các trang web đó có link trong trang https://blogchiasekienthuc.com.
  • Process JavaScript: Lựa chọn chức năng này nếu bạn muốn cho các ứng dụng có liên quan đến Java cũng được sao lưu lại, nhưng nếu như bạn chưa chắc chắn về mức độ an toàn của website/blog muốn sao lưu thì không nên chọn chức năng này nhé.

Ngoài những tính năng trên bạn có thể vào thẻ Advanced để sử dụng thêm một số tùy chọn đặc biệt. Tiếp theo bạn hãy, bấm Next để chuyển sang bước cuối cùng.

luu-toan-bo-trang-web-3

Bước 4: Chọn định dạng file mà bạn muốn lưu.

Mặc định của chương trình sẽ là All Files , tức là sẽ tải về toàn bộ các định dạng file có trên website đó.

  • Search files in this site only: Có nghĩa là chỉ tìm kiếm và tải về những thành phần của website bạn muốn sao lưu, không tìm kiếm ở những website khác có link nằm trong website bạn muốn lưu.
  • Hide duplicate files found in different locations: Ẩn những file trùng lặp ở những vị trí khác nhau để tránh việc ghi đè lên file đang có.
  • Start downloading all matched files at once: Thực hiện song song việc tìm kiếm và tải về các file thành phần của trang web.

Tips: Bạn có thể thiết lập như hình bên dưới và nhấn vào Next để bắt đầu quá trình download, việc download nhanh hay chậm thì phục thuộc vào dung lượng của website đó.

Thường thì mất khá nhiều thời gian để tải về hoàn chỉnh một trang web.

luu-toan-bo-trang-web-6

Quá trình tải trang web đang diễn ra, bạn có thể để ẩn xuống và làm các công việc khác.

luu-toan-bo-trang-web-4

Cuối cùng là bạn vào thư mục chứa dữ liệu website vừa tải về và chạy những file có đuôi *.html để đọc nội dung nhé.

#3. Sử dụng phần mềm HTTrack Website Copier (khuyên dùng)

HTTrack Website Copier là một phần mềm chuyên dụng để hỗ trợ cho việc lưu lại nội dung toàn bộ trang web, phần mềm này sẽ giúp bạn truy cập vào một trang web offline vô cùng chuyên nghiệp, không khác gì bản trực tuyến cả.

Để dễ hình dung hơn về những gì mình đang nói thì bạn có thể xem chi tiết hơn trong bài hướng dẫn này: Làm thế nào để download toàn bộ website về máy tính?

#4. Sử dụng câu lệnh để tải

//Cách này dành cho anh em am hiểu một chút về máy tính, nhìn thì có vẻ phức tạp nhưng làm rất đơn giản và hiệu quả.

4.1. Tải toàn bộ trang web trên Windows

Bước 1. Bạn cài phần mềm bổ trợ tại đây: https://eternallybored.org/misc/wget/

Tải file EXE, chọn phiên bản x64 (Windows 64bit) hoặc x86 (Windows 32bit), cách xem máy tính đang sử dụng Windows 32bit hay 64bit.

Bước 2. Sau khi tải về => bạn hãy copy vào đường dẫn sau: C:\Windows\System32

Bước 3. Mở CMD với quyền Admin lên => sau đó copy câu lệnh bên dưới để chạy:

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://blogchiasekienthuc.com

// Đổi tên trang web trong lệnh bên trên bằng trang web bạn muốn tải là được.

Bước 4. Đợi cho quá trình tải hoàn tất là xong, trang web tải về sẽ nằm ở thư mục:

C/use/Tên_Máy/blogchiasekienthuc.com

Xem video hướng dẫn tại đây <dịch phụ đề Youtube>:

4.2. Tải toàn bộ trang web trên MacOS

Trên MacOS hoặc Linux thì bạn có thể chạy trực tiếp lệnh được nhé.

II. Lời kết

Như vậy là bạn đã lưu lại toàn bộ trang web mà bạn cần rồi đó, việc lưu lại toàn bộ trang web là khá lâu nên bạn hãy kiên nhẫn chờ đợi nhé :D. Hi vọng bài viết sẽ hữu ích cho bạn. Chúc thành công!!!

Kiên Nguyễn – Blogchiasekienthuc.com
Tham khảo KHPT

Bài viết đạt: 4.7/5 sao - (Có 8 lượt đánh giá)
Note: Bài viết này hữu ích với bạn chứ? Đừng quên đánh giá bài viết, like và chia sẻ cho bạn bè và người thân của bạn nhé !

Administrator: Kiên Nguyễn

Có một câu nói của người Nhật mà mình rất thích đó là " Người khác làm được thì mình cũng làm được ". Chính vì thế mà hãy theo đuổi đam mê, thành công sẽ theo đuổi bạn ! Nếu như bạn đang gặp khó khăn và cần sự trợ giúp thì hãy comment phía bên dưới mỗi bài viết để nhận được sự hỗ trợ từ cộng đồng Blog Chia Sẻ Kiến Thức nhé.

24 comments

  1. giangnguyen8605

    Thủ thuật rất hay đó Kiên ah. Nhớ ngày xưa hay xài teleport pro để download toàn trang web thì tốc độ cũng khá, giờ có idm download thì chắc sẽ nhanh hơn rất nhiều rồi. Thank Kiên.

  2. Anh ơi cho em hỏi với ạ, lúc tải bằng idm nhưng mà em chỉ muốn tải cái nội dung (tức là phần text) của web thôi ấy ạ, thì phải làm như thế nào ạ?? Em down về nhưng nó vẫn giưz nguyên phần css của web :((

    • Kiên Nguyễn Blog

      Cái này nó tải toàn bộ trang web nhé bạn, nếu không tải css với hình ảnh thì làm sao mà bạn hiểu để mà đọc được, nó sẽ sắp xếp rất lộn xộn.

      • em hỏi anh ở mail rồi đấy ạ :(( ở đây không gửi được file ạ

        • Kiên Nguyễn Blog

          Để mai mình xem cho nhé, giờ mình đang có việc chút nên không ngồi máy tính.

          • vâng ạ. Nếu copy online từng cái thì lâu quá nên em muốn tìm hiểu cách down về cho nhanh :((

          • Kiên Nguyễn Blog

            Download toàn bộ trang web mà nguyên text thì mình chưa thử bao giờ cả. Để mình xem lại xem sao.

  3. Trinh Quang Phong

    Nó chạy tới khi nào mới xong vậy bạn. Mình chẳng thấy có thông báo phần % hay gì đó tương tự để biết được nó đang down về tới đâu rồi

    • Kiên Nguyễn Blog

      Ở dưới thanh Taskbar có hiện đó bạn, hoặc là bạn mở IDM ra để xem tiến trình tải của nó nhé.

  4. Thanks bạn. Mình đang tải thử. Chưa xong nhưng thấy rất hữu ích.

  5. nguyễn tiến đạt

    bạn hướng dẫn cài đặt phần mềm giả lập adroid leapdroid đi bạn thấy người ta bảo nhẹ

    • Kiên Nguyễn Blog

      Mình giới thiệu 3 phần mềm giả lập tốt nhất hiện nay rồi đó bạn. Giả lập thì không có cái nào nhẹ hơn đâu 😀

  6. Trịnh Quang Phong

    Bạn Kiên Nguyễn ơi có cánh nào mình tìm được thông tin trong trang web mà mình đã lưu offline không? Ví dụ mình tải toàn bộ rồi và trong trang web đó có nói đến vấn đề mình cần, nhưng không nhở chính xác là nó ở đâu, có cách nào gõ từ mình cần tìm ra giống như google không?

    • Kiên Nguyễn Blog

      Mình nhớ trước test thử thì vẫn sử dụng nút search trên web offline được mà nhỉ.

      • Trịnh Quang Phong

        Mình tìm mà nó báo ko có mạng bạn à

        • Trịnh Quang Phong

          Sao như này mà đợi mãi nó không download tiếp những cái sau bạn à (từ mũi tên chỉ xuống)

          http://www.upsieutoc.com/image/YAlE2s

  7. Cám ơn bạn đã chia sẻ kiến thức

  8. nếu muốn lưu 1 nhánh thôi thì sao bác…cho link vào rồi toàn down cả web luôn chứ k down riêng nhánh đó
    ví dụ như mình down 1 bộ truyện chữ là http://valvrareteam.com/touhou-no-maou.html
    nhưng IDM down luôn những truyện khác ở http://valvrareteam.com chứ k down riêng 1 bộ mình chỉ định

    • Kiên Nguyễn Blog

      Vậy bạn thử sử dụng phần mềm xem sao, IDM hình như chỉ down được nguyên trang thôi bạn.

      • Nếu trang web đó có mật khẩu đăng nhập và dwx liệu tính bằng công thức minh có dowload về sử dụng dữ liệu offline dc không vậy Kiên Nguyễn Blog

  9. Có cách nào như vầy mà làm được trên điện thoại không bạn ?


Một vài lưu ý trước khi comment :

Thư điện tử của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *
Tất cả các comment của các bạn sẽ được giải đáp trong vòng 48h !
Không được sử dụng từ khóa trong ô 'Name', bạn hãy dùng tên thật hoặc Nickname của bạn !
Không dẫn link sang trang web/blog khác. Xem quy định comment tại đây. Thank All!

Leave a Reply

Your email address will not be published. Required fields are marked *

Shop