Hướng dẫn lấy tin từ vnExpress bằng plugin “Lay Tin vnExpress cho WordPress”

Hiện đã có phiên bản Lấy Tin vnExpress v.Pro với chức năng spin nội dung, spin tiêu đề, chèn link theo từ khóa, xử lí ảnh tránh Google nhận biết trùng lặp đi kèm với hơn 30 file data spin sưu tầm. Bạn có thể đặt mua với mức giá 500.000 VND (thanh toán bằng thẻ cào) cho plugin Lấy Tin vnExpress v.Pro tại đây để ủng hộ cho nhà phát triển.

Để bắt đầu phần cấu hình Lấy tin vnExpress cho WordPress bạn đăng nhập vào trang quản trị rồi chuyển đến mục Lấy tin tại menu gần cuối phía tay trái như hình dưới.

Anh1

Tại đây có hai mục cần chú ý:

1) Lấy từ dòng:

Trong trường hợp có nhiều link từ nhiều chuyên mục cần lấy bạn muốn bắt đầu lấy từ dòng bao nhiêu thì điền số thứ tự của dòng bắt đầu vòng lặp tại đây. Điều này cũng đồng nghĩa với việc sẽ bỏ qua các dòng link trước nó không lấy tin tại các chuyên mục này. Như hình trên có hai link cần lấy tin, nếu tôi điền 2 thì plugin sẽ bắt đầu lấy tin từ mục kinh doanh và bỏ qua mục thế giới. Tính năng này rất ít sử dụng thông thường sẽ cài đặt là 1 để bắt đầu lấy tất cả các link theo cấu hình.

2) Cấu hình link:

Đây là phần cấu hình quan trọng bạn cần thao tác chính xác để có thể lấy tin đúng nhất.

Mỗi link được cách nhau bằng một dòng.

Phần thông số cấu hình cho mỗi link cách nhau bằng kí tự cách trống.

Mỗi link có 8 thông số cấu hình bao gồm:

+ Thứ nhất: URL đây là đường dẫn đến chuyên mục luôn kết thúc bằng dấu xuộc / như ví dụ trên có thể thấy là: http://vnexpress.net/tin-tuc/the-gioi/

+ Thứ hai: Số tin là số tin bạn cần lấy tại chuyên mục này.

+ Thứ ba: Trang bắt đầu là số thứ tự trang bạn muốn bắt đầu lấy tin từ đấy.

+ Thứ tư: Gán người đăng tin là ID của người sẽ đăng tin. Thông thường bạn nên tạo một tài khoản người dùng tương ứng với trang cần lấy, trong trường hợp này tôi sẽ tạo một người dùng có tên là vnExpress và lấy ID của người này để điền vào.

+ Thứ năm: Tổng số tin là số tin đã lấy được từ link này, ban đầu nên đặt là 0 các lượt tiếp theo sẽ tự động cập nhật số lượng tin mà bạn lấy được (tổng số tin lấy được ở đây chỉ có tính tương đối, không chính xác 100% do dữ liệu chỉ được cập nhật khi chuyển trang tránh tình trạng ra vào csdl quá nhiều trong lúc lấy tin làm chậm hệ thống)

+ Thứ sáu: Kích hoạt, mục này có hai cấu hình là 0 và 1, nếu bạn muốn bỏ qua không lấy tin ở link nào thì gán giá trị 0, và để kích hoạt gán giá trị 1.

+ Thứ bảy: Thư mục là ID của các chuyên mục bạn đổ tin về, trong trường hợp muốn bài đăng ở nhiều chuyên mục các ID viết liền nhau và cách nhau bằng dấu phẩy, không có khoảng trắng ở cấu hình các ID này ( vd: 1,5,34,45 ).

+ Thứ tám: Số trang cần lấy, mặc định đặt giá trị này là -1 để lấy theo thông số Số tin tự động cần lấy. Nếu bạn đặt một giá trị lớn hơn 0 thì plugin sẽ ưu tiên thông số Số trang cần lấy trước. Giả sử bạn chỉ cần cập nhật tin mới từ hai trang đầu mục Tin thế giới của VnExpress bạn cần đặt thông số Số tin cần lấy tự động là 100, trang bắt đầu1 và đặt Số trang cần lấy tự động là 2 thì ngay khi quét hết trang thứ 2 plugin sẽ chuyển qua lấy tin ở mục tiếp theo mặc dù chưa lấy đủ 100 tin, tính năng này tránh cho việc quét qua quá nhiều các tin đã lấy từ trước đó gây tốn thời gian lấy tin tự động của bạn.

Đến đây bạn có thể kết thúc cấu hình cho một link cần lấy, các link tiếp bạn xuống dòng và thực hiện tương tự rồi ấn vào Lưu cấu hình để lưu lại thông tin. Sau khi thông tin đã được lưu bạn đã có thể lấy tin như cấu hình bằng cách ấn vào nút Lấy tin và chờ cho đến khi kết thúc load xong.

Một vài thông tin lưu ý:

Bạn cần thay đổi max_execution_time của cấu hình PHP tại file php.ini cho phù hợp với thời gian lấy tin trước khi thực hiện (mặc đinh max_execution_time thường là 300s). Mình đã thử bấm giờ với gói cước cáp quang thấp nhất thì thời gian trung bình để lấy một tin là 6s, bạn nhân lên với số tin cần lấy sẽ có tổng thời gian để cấu hình. Giả sử mình cần lấy 1.000 tin thì tổng thời gian dự kiến khoảng 6.000s và để chắc ăn mình sẽ rộng rãi cấu hình lên hẳn 9.000s tránh các rủi ro khác về tốc độ mạng.

Nếu bạn đang dùng share host không nên chạy plugin này vì tốn tài nguyên và có thể phải làm việc với nhà cung cấp, cấu hình tốt nhất là Server riêng hoặc chí ít là VPS và các dạng Cloud computer khác (Giải pháp cho share host tạm chấp nhận được là backup site về localhost và tiến hành chạy trên localhost rồi up trở lại sau). Nếu bạn có cáp quang tại nhà cùng dư thừa máy tính (laptop hay máy bàn đều được) liên hệ lại với WebBinhDan.com để được hướng dẫn cấu hình thành máy chủ không cần thuê server riêng nữa.

Plugin đang trong giai đoạn đầu phát triển nên còn nhiều điểm chưa hợp lí cũng như các lỗi có thể phát sinh, hi vọng nhận được sự phản hồi cũng như ý kiến đóng góp từ các bạn để plugin ngày một hoàn thiện hơn.

Source của plugin đã được comment rất cẩn thận, bạn có thể sử dụng để cấu hình các site khác theo ý mình. Nếu có nhu cầu về lấy tin tức hay rao vặt tại các nguồn khác bạn liên hệ với WebBinhDan.com để đặt hàng thêm như một cách hỗ trợ cho chúng tôi.

Chúc bạn một ngày làm việc hiệu quả!

Update 1: download plugin Lay Tin vnExpress cho WordPress.

Update 2: hướng dẫn lấy tin mục Sức khẻ từ VnExpress.

Phụ lục: cấu hình tất cả các mục hiện thời của VnExpress, bạn chỉ việc copy về và loại bỏ những mục không phải lấy tin cũng như cấu hình lại thông số theo ý muốn. Thông số tạm thời này chỉ lấy 1 tin của mỗi mục tại 1 trang đầu:

https://vnexpress.net/tin-tuc/the-gioi/ 1 1 1 0 1 1 1
https://kinhdoanh.vnexpress.net/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/thoi-su/ 1 1 1 0 1 1 1
https://giaitri.vnexpress.net/ 1 1 1 0 1 1 1
https://thethao.vnexpress.net/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/phap-luat/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/giao-duc/ 1 1 1 0 1 1 1
https://giadinh.vnexpress.net/ 1 1 1 0 1 1 1
https://dulich.vnexpress.net/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/khoa-hoc/ 1 1 1 0 1 1 1
https://sohoa.vnexpress.net/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/oto-xe-may/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/cong-dong/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/tam-su/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/cuoi/ 1 1 1 0 1 1 1
https://suckhoe.vnexpress.net/tin-tuc/cac-benh/ 1 1 1 0 1 1 1
https://suckhoe.vnexpress.net/tin-tuc/suc-khoe/ 1 1 1 0 1 1 1
https://suckhoe.vnexpress.net/tin-tuc/khoe-dep/ 1 1 1 0 1 1 1
https://suckhoe.vnexpress.net/tin-tuc/dinh-duong/ 1 1 1 0 1 1 1

Share this post

Comments (18)

  • Nguyen Tan Qua

    Lấy nhiều llink được khoogn?
    sao mình get có 3 link mà nó đứng không lấy được luôn

    9 Tháng Tám, 2016 at 1:53 sáng
    • WebBinhDan

      Bạn xem lại phần hướng dẫn,nếu đang dùng share host, thời gian thực thi của PHP là rất ngắn (300s) và ít nhà cung cấp cho chỉnh sửa thông số này.

      12 Tháng Tám, 2016 at 8:23 sáng
  • Tomm

    Hi bác cho e hỏi lỗi này fix sao ạ
    Fatal error: Maximum execution time of 30 seconds exceeded in C:\xampp\htdocs\project\wp-includes\class-wp-http-curl.php on line 313
    E chạy config : http://vnexpress.net/tin-tuc/cuoi/ 1 1 1 0 1 1 1

    9 Tháng Tám, 2016 at 4:34 sáng
    • WebBinhDan

      Bạn cần cấu hình lại PHP để thời gian thi lâu hơn, mục “Chú ý” của bài hướng dẫn có đề cập đến vấn đề này, bạn có thể xem lại!

      12 Tháng Tám, 2016 at 8:24 sáng
  • Nguyen Tan Qua

    Chào bạn, mình thấy cần thêm là nguồn tin từ đâu nữa là ok hơn
    thanks

    10 Tháng Tám, 2016 at 4:54 sáng
    • WebBinhDan

      Phiên bản tiếp mình sẽ cho đấy là một lựa chọn, cảm ơn bạn đã góp ý!

      12 Tháng Tám, 2016 at 10:01 sáng
  • Quang Nam

    Chào bạn, khi mình lấy tin thì tiêu đề nó có 1 cái [ ] , và cái này có chèn vô permalink luôn, mình ko thích nó như vậy, bạn có thể hỗ trợ mình không ?
    Ví dụ bài này trong mục ô tô xe máy :
    Link vnexpress : http://vnexpress.net/tin-tuc/oto-xe-may/khach-viet-han-che-mua-xe-sang-co-lon-sau-1-7-3451403.html
    Link bài viết của mình khi lấy tin xong: http://hoclaixeotohcm.com/lexus-giam-gia-khach-viet-han-che-mua-xe-sang-co-lon-sau-17.html

    15 Tháng Tám, 2016 at 4:51 sáng
    • WebBinhDan

      Bạn vào thư mục assets của plugin.
      Sửa file get_news_calss.php
      Dòng 328
      Xóa phần này nhé (chính xác đến cả dấu chấm sau cùng):
      ‘[‘.ucfirst($arr_tags[1]).’] ‘.
      p/s: tính năng này mọi người làm SEO rất thích đấy bạn à, một dạng spin nhẹ cho tiêu đề.

      16 Tháng Tám, 2016 at 8:03 sáng
  • Blog Tự Học SEO

    Em cũng mới biết cái này, cho em hỏi khi lấy được tin thì tin không hiển thị, em tìm thì thấy tin ở trong Uncategorized, giờ làm sao em fix được ạ

    16 Tháng Tám, 2016 at 4:00 chiều
    • WebBinhDan

      Trong phần setup cho mỗi link, nếu bạn dùng cấu hình sẵn tại bài hướng dẫn thì đổi số thứ bảy của dãy thành ID của chuyên mục bạn muốn đổ tin về là được.
      VD cần đổ tin về thư mục có ID là 9 thì trong link mẫu này: http://suckhoe.vnexpress.net/tin-tuc/cac-benh/ 1 1 1 0 1 1 1 sẽ sửa lại là:

      http://suckhoe.vnexpress.net/tin-tuc/cac-benh/ 1 1 1 0 1 9 1

      16 Tháng Tám, 2016 at 4:21 chiều
  • binhhb8b

    Em vẫn chưa hiểu cái này lắm ạ. Giả sử em muốn mỗi ngày lấy 10 tin mới nhất từ url: http://giaitri.vnexpress.net/ về, thì mẫu như nào ạ

    15 Tháng Chín, 2016 at 7:40 sáng
    • WebBinhDan

      Bạn dùng cấu hình này nhé: http://giaitri.vnexpress.net/ 10 1 1 0 1 1 1
      Hiện tại vẫn chưa có cron cho plugin này, để lấy tin hàng ngày bạn phải tự kích hoạt lấy tin.

      15 Tháng Chín, 2016 at 11:44 chiều
  • ngocthuy88

    nếu em muốn lấy mục http://giaitri.vnexpress.net/ 200 tin, bắt đầu từ trang 110 trở về trang 1 (cũ lấy trước, mới lấy sau) thì thông số sẽ ra sao ạ ?!

    19 Tháng Chín, 2016 at 3:08 chiều
    • WebBinhDan

      http://giaitri.vnexpress.net/ 200 1 1 0 1 1 110
      Vì ngày đăng sẽ lấy theo thông có trong bài viết nên thứ tự bài đăng sẽ là cố đinh từ cũ đến mới rồi bạn à, với cấu hình trên giới hạn nào đến trước sẽ dừng trước, vd mới chỉ đến trang 99 nhưng đã đủ 200 bài viết thì plugin sẽ dừng ở trang 99, hoặc đến trang 110 nhưng mới chỉ lấy được 99 tin chưa đủ 200 thì plugin cũng sẽ dừng lại.
      Còn nếu bắt buộc phải lấy ngược thì plugin ko được viết theo logic đấy bạn à, nhưng có thể định lượng trước để có kết quả như lấy ngược, mỗi trang vnexpress có 29 tin, với ví dụ của bạn muốn lấy 200 tin tính gần đúng sẽ là 7 trang tin thì bạn có thể lấy từ trang 103 với cấu hình:
      http://giaitri.vnexpress.net/ 200 193 1 0 1 1 7

      20 Tháng Chín, 2016 at 4:41 sáng
  • Huỳnh Thiện Trí

    Mình muốn được hướng dẩn dựng sever từ máy tính .Mong được hướng dẩn

    17 Tháng Mười Hai, 2016 at 9:52 sáng
    • WebBinhDan

      Mình sẽ sớm viết bài hướng dẫn sớm ngay khi có thời gian rỗi.
      Cảm ơn bạn đã quan tâm đến dịch vụ của bên mình!

      17 Tháng Mười Hai, 2016 at 1:40 chiều
  • lizad

    mình get tin bị lổi Error download images: http://img.f30.vnecdn.net/2017/02/04/3CCFAEB1000005784189382FirstladyMelaniaTrumpleftWashingtonafterherhusbandsinaa41486162029493-1486176185.jpg :
    Error imgages
    chỉ có nội dung không có hình bạn ơi, làm sao khắc vậy vậy bạn

    1 Tháng Ba, 2017 at 9:17 chiều
    • WebBinhDan

      Chỉ lỗi mỗi bài này hay các bài đều bị hiện tượng này vậy bạn, nếu là nhiều bài bạn kiểm tra lại phân quyền ghi file của thưc mục chứa plugin. Hoặc có thể chat trực tiếp với hỗ trợ bên mình để được trợ giúp chính xác nhất. Chúc bạn một ngày làm việc hiệu quả!

      4 Tháng Ba, 2017 at 4:24 sáng

Trả lời