1 tháng 3, 2013

Các vấn đề SEO Wordpress nâng cao - cập nhật mới 2013

Hôm qua một người bạn nhờ tư vấn một buổi cho đội quản trị site start-up của nhóm hắn xây trên nền WP, với vẻ rất tin cậy ở mình. Giật mình! Mình đáng tin cậy vậy sao. Không dám chắc là sẽ giúp được đến nơi đến chốn, nhưng cũng gật gật ừ ừ và lần mò lại những gì ngày xưa đã biết và nghịch qua.

Đã quá lâu không mày mò site WP, những bài blog hướng dẫn tối ưu cho site WP mình phớt lờ chẳng đọc.Đặc biệt là những gì về SEO.

Cũng nhờ sự cậy nhờ của bạn mà mình hứng thú có hứng thú gỡ mốc cho blog. Đây sẽ là bài tóm tắt lại slide "Advanced WordPress SEO: Actionable Advice for Ensuring Your WordPress Content is Found" của SEOMOZ. Mới thực hiện đầu tháng  2 và đúng là đã mở mang nhiều kiến thức mới về SEO WP trong mình.
__________________

Vấn đề 1:NỘI DUNG TRÙNG LẶP TRONG WORDPRESS

Xuất phát từ:
* Trang nhãn - Tag pages
* Trang danh mục - Categories pages
* Trang lưu trữ theo ngày - Date Archive pages
* Trang tác giả - Author pages
* Trang đánh số trang - Pagination pages
Nội dung trùng lặp
Nội dung trùng lặp do trang nhãn

- Bắt bệnh:
* Do văn bản bài viết đầy đủ xuất hiện trên trang chủ, trang nhãn, trang danh mục, v.v.
* Không có nội dung giá trị hơn cho người tìm kiếm
* Các trang đánh số trang cũng chứa nội dung trùng lặp
* Phần sidebar dài trên site liên kết đến các trang trùng lặp đó
* Nhiều theme không cho phép người dùng tùy biến thẻ META trên các page này.

Kết quả là: nếu người dùng không để ý, sẽ bị Google bắt lỗi nội dung trùng lặp một cách oan uổng.

CÂU HỎI: Cần phải làm gì đó đối với việc hiển thị bài viết đầy đủ  xuất hiện trên toàn bộ trang lưu trữ!
TRẢ LỜI: thay thế "the_content" trong tệp PHP bằng "the_excerpt"
Nhờ đó, thay vì hiện toàn bộ nội dung bài viết, giờ đây các trang lưu trữ chỉ hiện 55 ký tự đầu tiên trong bài viết.
Sửa file PHP trong mục Appearance -> Editor

Các tệp PHP cần chú ý:
- Archive.php
 - Index.php
- Các file PHP tùy biến theo theme quyết định trang chứa bài lưu trữ

CÂU HỎI: Phải làm gì với vấn đề không độc nhất (Non-uniqueness)
TRẢ LỜI: Noindex và xóa khỏi XML Sitemap
CÂU HỎI: Có thể làm cho các trang này hữu ích hơn cho người dùng?
TRẢ LỜI: Tạo một trang PHP mới cho từng loại trang dự trữ, và chèn bản copy này trực tiếp vào các tệp PHP.
Nhờ đó, từng trang PHP sẽ có một phần nội dung độc nhất. Ví dụ: trên trang về tác giả, như bình thường sẽ hiện loạt bài viết do tác giả đó đăng, nhờ phần nội dung thông tin về tác giả bổ sung, trang tác giả sẽ trở nên khác biệt với trang danh mục, trang lưu trữ theo ngày, v.v.

thêm nội dung bổ sung cho các page lưu trữ wordpress


Các bước tạo trang tùy biến với đoạn văn bản tối ưu hóa SEO cho một nhãn (ví dụ nhãn Marketing)
- B1: Đến tệp PHP (Appearance => Editor)
- B2: Trên máy chủ, tạo một file "tag-marketing.php" trong thư mục tệp PHP của theme
- B3: Copy mã từ file "archive.php" đã có và dán vào file "tag-marketing.php" mới
- B4: Định vị trí nơi văn bản chính của page bắt đầu
- B5: Chèn văn bản nhãn trên khu vực mà bài viết xuất hiện

CÂU HỎI: Chúng ta nên xử lý sao với các trang đánh số trang? 
TRẢ LỜI: Yoast SEO sẽ chèn rel=“next” và rel=“prev” trong phần đầu các trang được đánh số
yoast-SEO-pagination-page-wordpress


CÂU HỎI: Thế còn về canonicalization? (không nhớ được nên dịch là gì)
TRẢ LỜI:  Yoast SEO sẽ bao gồm cả những thứ đó trong tất cả các trang wordpress (thêm rel="canonical")

CÂU HỎI: Nếu dùng plugin tận dụng các tham số của URL? (nguyên văn là What if I use a plugin that utilizes URL parameters? - liên quan đến URL động & tĩnh)
TRẢ LỜI: Sử dụng robots.txt hoặc GWT.
- Tạo một file robots.txt và đặt trong thư mục gốc để viết đè lên file của Wordpress, nhờ đó sẽ chặn được các thành phần của site có vấn đề
 - Hoặc chặn các tham số có vấn đề từ trong GWT.

Vấn đề 2: THỰC HIỆN TÁC QUYỀN

Chúng ta cần:
- Hồ sơ Google+
- Liên kết đến site nội dung ở trong mục "Contributor to" trong hồ sơ Google+
-  Thêm thẻ rel="author" vào trang bài blog trong liên kết đến hồ sơ Google+

Các bước chi tiết có thể tham khảo bài viết Thiết lập quyền tác giả Google cho bài viết, website, blog


Vấn đề 3: CÁC YẾU TỐ ON-SITE NÂNG CAO KHÁC

Permalinks

- Theo thói thường, và từ hồi biết làm wordpress, mình vẫn thường được dạy permalink cho blog WP mới kiểu như sau:

- /%postname% / %post_id%/
- hoặc /%category% / %postname%/

Sự thật WP đã phát biểu rằng:
“For performance reasons, it is not a good idea to start your permalink structure with the category, tag, author, or postname fields. The reason is that these are text fields, and using them at the beginning of your permalink structure  takes more time for WordPress to distinguish your Post URLs from Page URLs (which always use the text “page slug” as the URL), and to compensate, WordPress stores a lot of extra information in its database (so much that sites with lots of Pages have experienced difficulties). So, it is best to start your permalink structure with a numeric field, such as the year or post ID.”

"Bởi những lý do về hiệu suất, việc bạn bắt đầu cấu trúc của liên kết cố định bằng trường danh mục, thẻ, tác giả, hay tên bài không phải là một ý tưởng tốt. Lý do là đó là những trường văn bản, và sử dụng chúng ở phần đầu cấu trúc liên kết cố định sẽ gây mất thời gian cho WP để phân biệt URL bài đăng và URL trang (thường sử dụng văn bản "page slug" là URL), và bù lại, WP phải chứa nhiều thông tin thừa thãi trong CSDL (quá nhiều khiến site với nhiều trang sẽ gặp khó khăn về hiệu suất). Vì thế, tốt nhất hãy bắt đầu cấu trúc liên kết cố định bằng trường số, ví dụ như năm hoặc thứ tự bài viết."

(Oh oh @@ thế là mình chuyên sửa cái đúng thành sai hả?? :( )

Vì thế, hãy để permalink như sau: /%post_id% / %postname%/  hoặc  /%year% / %category% / %postname%/

Vấn đề 4: DUY TRÌ VIỆC TUÂN THỦ SEO

Các công cụ:
- ScreamingFrog
- SEOMoz
- Google Webmaster Tools


------------
Nguồn: Slide và phần trình bày của diễn giả được tải về từ SEOMoz

Lười nên hình ảnh copy nguyên xi từ slide.

____________
Bị giật mình: Cái blog Vietinbound này cũng hiện full post. ko biết có bị dính kiểu giống như WP ko đây? :-ss