Hướng dẫn lấy tin từ vnExpress bằng plugin “Lay Tin vnExpress cho WordPress”

Hiện đã có phiên bản Lấy Tin vnExpress v.Pro với chức năng spin nội dung, spin tiêu đề, chèn link theo từ khóa, xử lí ảnh tránh Google nhận biết trùng lặp đi kèm với hơn 30 file data spin sưu tầm. Bạn có thể đặt mua với mức giá 500.000 VND (thanh toán bằng thẻ cào) cho plugin Lấy Tin vnExpress v.Pro tại đây để ủng hộ cho nhà phát triển.

Để bắt đầu phần cấu hình Lấy tin vnExpress cho WordPress bạn đăng nhập vào trang quản trị rồi chuyển đến mục Lấy tin tại menu gần cuối phía tay trái như hình dưới.

Anh1

Tại đây có hai mục cần chú ý:

1) Lấy từ dòng:

Trong trường hợp có nhiều link từ nhiều chuyên mục cần lấy bạn muốn bắt đầu lấy từ dòng bao nhiêu thì điền số thứ tự của dòng bắt đầu vòng lặp tại đây. Điều này cũng đồng nghĩa với việc sẽ bỏ qua các dòng link trước nó không lấy tin tại các chuyên mục này. Như hình trên có hai link cần lấy tin, nếu tôi điền 2 thì plugin sẽ bắt đầu lấy tin từ mục kinh doanh và bỏ qua mục thế giới. Tính năng này rất ít sử dụng thông thường sẽ cài đặt là 1 để bắt đầu lấy tất cả các link theo cấu hình.

2) Cấu hình link:

Đây là phần cấu hình quan trọng bạn cần thao tác chính xác để có thể lấy tin đúng nhất.

Mỗi link được cách nhau bằng một dòng.

Phần thông số cấu hình cho mỗi link cách nhau bằng kí tự cách trống.

Mỗi link có 8 thông số cấu hình bao gồm:

+ Thứ nhất: URL đây là đường dẫn đến chuyên mục luôn kết thúc bằng dấu xuộc / như ví dụ trên có thể thấy là: http://vnexpress.net/tin-tuc/the-gioi/

+ Thứ hai: Số tin là số tin bạn cần lấy tại chuyên mục này.

+ Thứ ba: Trang bắt đầu là số thứ tự trang bạn muốn bắt đầu lấy tin từ đấy.

+ Thứ tư: Gán người đăng tin là ID của người sẽ đăng tin. Thông thường bạn nên tạo một tài khoản người dùng tương ứng với trang cần lấy, trong trường hợp này tôi sẽ tạo một người dùng có tên là vnExpress và lấy ID của người này để điền vào.

+ Thứ năm: Tổng số tin là số tin đã lấy được từ link này, ban đầu nên đặt là 0 các lượt tiếp theo sẽ tự động cập nhật số lượng tin mà bạn lấy được (tổng số tin lấy được ở đây chỉ có tính tương đối, không chính xác 100% do dữ liệu chỉ được cập nhật khi chuyển trang tránh tình trạng ra vào csdl quá nhiều trong lúc lấy tin làm chậm hệ thống)

+ Thứ sáu: Kích hoạt, mục này có hai cấu hình là 0 và 1, nếu bạn muốn bỏ qua không lấy tin ở link nào thì gán giá trị 0, và để kích hoạt gán giá trị 1.

+ Thứ bảy: Thư mục là ID của các chuyên mục bạn đổ tin về, trong trường hợp muốn bài đăng ở nhiều chuyên mục các ID viết liền nhau và cách nhau bằng dấu phẩy, không có khoảng trắng ở cấu hình các ID này ( vd: 1,5,34,45 ).

+ Thứ tám: Số trang cần lấy, mặc định đặt giá trị này là -1 để lấy theo thông số Số tin tự động cần lấy. Nếu bạn đặt một giá trị lớn hơn 0 thì plugin sẽ ưu tiên thông số Số trang cần lấy trước. Giả sử bạn chỉ cần cập nhật tin mới từ hai trang đầu mục Tin thế giới của VnExpress bạn cần đặt thông số Số tin cần lấy tự động là 100, trang bắt đầu1 và đặt Số trang cần lấy tự động là 2 thì ngay khi quét hết trang thứ 2 plugin sẽ chuyển qua lấy tin ở mục tiếp theo mặc dù chưa lấy đủ 100 tin, tính năng này tránh cho việc quét qua quá nhiều các tin đã lấy từ trước đó gây tốn thời gian lấy tin tự động của bạn.

Đến đây bạn có thể kết thúc cấu hình cho một link cần lấy, các link tiếp bạn xuống dòng và thực hiện tương tự rồi ấn vào Lưu cấu hình để lưu lại thông tin. Sau khi thông tin đã được lưu bạn đã có thể lấy tin như cấu hình bằng cách ấn vào nút Lấy tin và chờ cho đến khi kết thúc load xong.

Một vài thông tin lưu ý:

Bạn cần thay đổi max_execution_time của cấu hình PHP tại file php.ini cho phù hợp với thời gian lấy tin trước khi thực hiện (mặc đinh max_execution_time thường là 300s). Mình đã thử bấm giờ với gói cước cáp quang thấp nhất thì thời gian trung bình để lấy một tin là 6s, bạn nhân lên với số tin cần lấy sẽ có tổng thời gian để cấu hình. Giả sử mình cần lấy 1.000 tin thì tổng thời gian dự kiến khoảng 6.000s và để chắc ăn mình sẽ rộng rãi cấu hình lên hẳn 9.000s tránh các rủi ro khác về tốc độ mạng.

Nếu bạn đang dùng share host không nên chạy plugin này vì tốn tài nguyên và có thể phải làm việc với nhà cung cấp, cấu hình tốt nhất là Server riêng hoặc chí ít là VPS và các dạng Cloud computer khác (Giải pháp cho share host tạm chấp nhận được là backup site về localhost và tiến hành chạy trên localhost rồi up trở lại sau). Nếu bạn có cáp quang tại nhà cùng dư thừa máy tính (laptop hay máy bàn đều được) liên hệ lại với WebBinhDan.com để được hướng dẫn cấu hình thành máy chủ không cần thuê server riêng nữa.

Plugin đang trong giai đoạn đầu phát triển nên còn nhiều điểm chưa hợp lí cũng như các lỗi có thể phát sinh, hi vọng nhận được sự phản hồi cũng như ý kiến đóng góp từ các bạn để plugin ngày một hoàn thiện hơn.

Source của plugin đã được comment rất cẩn thận, bạn có thể sử dụng để cấu hình các site khác theo ý mình. Nếu có nhu cầu về lấy tin tức hay rao vặt tại các nguồn khác bạn liên hệ với WebBinhDan.com để đặt hàng thêm như một cách hỗ trợ cho chúng tôi.

Chúc bạn một ngày làm việc hiệu quả!

Update 1: download plugin Lay Tin vnExpress cho WordPress.

Update 2: hướng dẫn lấy tin mục Sức khẻ từ VnExpress.

Phụ lục: cấu hình tất cả các mục hiện thời của VnExpress, bạn chỉ việc copy về và loại bỏ những mục không phải lấy tin cũng như cấu hình lại thông số theo ý muốn. Thông số tạm thời này chỉ lấy 1 tin của mỗi mục tại 1 trang đầu:

https://vnexpress.net/tin-tuc/the-gioi/ 1 1 1 0 1 1 1
https://kinhdoanh.vnexpress.net/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/thoi-su/ 1 1 1 0 1 1 1
https://giaitri.vnexpress.net/ 1 1 1 0 1 1 1
https://thethao.vnexpress.net/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/phap-luat/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/giao-duc/ 1 1 1 0 1 1 1
https://giadinh.vnexpress.net/ 1 1 1 0 1 1 1
https://dulich.vnexpress.net/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/khoa-hoc/ 1 1 1 0 1 1 1
https://sohoa.vnexpress.net/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/oto-xe-may/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/cong-dong/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/tam-su/ 1 1 1 0 1 1 1
https://vnexpress.net/tin-tuc/cuoi/ 1 1 1 0 1 1 1
https://suckhoe.vnexpress.net/tin-tuc/cac-benh/ 1 1 1 0 1 1 1
https://suckhoe.vnexpress.net/tin-tuc/suc-khoe/ 1 1 1 0 1 1 1
https://suckhoe.vnexpress.net/tin-tuc/khoe-dep/ 1 1 1 0 1 1 1
https://suckhoe.vnexpress.net/tin-tuc/dinh-duong/ 1 1 1 0 1 1 1

18 thoughts on “Hướng dẫn lấy tin từ vnExpress bằng plugin “Lay Tin vnExpress cho WordPress”

    1. Bạn xem lại phần hướng dẫn,nếu đang dùng share host, thời gian thực thi của PHP là rất ngắn (300s) và ít nhà cung cấp cho chỉnh sửa thông số này.

    1. Bạn cần cấu hình lại PHP để thời gian thi lâu hơn, mục “Chú ý” của bài hướng dẫn có đề cập đến vấn đề này, bạn có thể xem lại!

  1. Chào bạn, khi mình lấy tin thì tiêu đề nó có 1 cái [ ] , và cái này có chèn vô permalink luôn, mình ko thích nó như vậy, bạn có thể hỗ trợ mình không ?
    Ví dụ bài này trong mục ô tô xe máy :
    Link vnexpress : http://vnexpress.net/tin-tuc/oto-xe-may/khach-viet-han-che-mua-xe-sang-co-lon-sau-1-7-3451403.html
    Link bài viết của mình khi lấy tin xong: http://hoclaixeotohcm.com/lexus-giam-gia-khach-viet-han-che-mua-xe-sang-co-lon-sau-17.html

    1. Bạn vào thư mục assets của plugin.
      Sửa file get_news_calss.php
      Dòng 328
      Xóa phần này nhé (chính xác đến cả dấu chấm sau cùng):
      ‘[‘.ucfirst($arr_tags[1]).’] ‘.
      p/s: tính năng này mọi người làm SEO rất thích đấy bạn à, một dạng spin nhẹ cho tiêu đề.

    1. http://giaitri.vnexpress.net/ 200 1 1 0 1 1 110
      Vì ngày đăng sẽ lấy theo thông có trong bài viết nên thứ tự bài đăng sẽ là cố đinh từ cũ đến mới rồi bạn à, với cấu hình trên giới hạn nào đến trước sẽ dừng trước, vd mới chỉ đến trang 99 nhưng đã đủ 200 bài viết thì plugin sẽ dừng ở trang 99, hoặc đến trang 110 nhưng mới chỉ lấy được 99 tin chưa đủ 200 thì plugin cũng sẽ dừng lại.
      Còn nếu bắt buộc phải lấy ngược thì plugin ko được viết theo logic đấy bạn à, nhưng có thể định lượng trước để có kết quả như lấy ngược, mỗi trang vnexpress có 29 tin, với ví dụ của bạn muốn lấy 200 tin tính gần đúng sẽ là 7 trang tin thì bạn có thể lấy từ trang 103 với cấu hình:
      http://giaitri.vnexpress.net/ 200 193 1 0 1 1 7

    1. Chỉ lỗi mỗi bài này hay các bài đều bị hiện tượng này vậy bạn, nếu là nhiều bài bạn kiểm tra lại phân quyền ghi file của thưc mục chứa plugin. Hoặc có thể chat trực tiếp với hỗ trợ bên mình để được trợ giúp chính xác nhất. Chúc bạn một ngày làm việc hiệu quả!

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *