百度目前在站內(nèi)搜索中支持5個(gè)數(shù)據(jù)模板的提交,分別是:通用、影視、小說、游戲、論壇。在實(shí)際的工作中處理過2個(gè),所以分享下這2個(gè)的處理方法。 1、按照慣例,百度的這個(gè)提交是需要用xml地圖集的形式,先來說說游戲模板
| <?xml version=”1.0″ encoding=”UTF-8″?> |
備注 |
| <urlset> |
|
| ??? <url> |
|
| ??????? <loc>http://www.880sy.com/games/64929.html#gid.html</loc> |
著陸頁 |
| ??????? <lastmod>2013-01-01</lastmod> |
文件一次更新時(shí)間 |
| ??????? <data> |
|
| ??????????? <name>*</name> |
游戲名稱 |
| ??????????? <url><![CDATA[http://www.880sy.com/games/64929.html#gid.html]]></url> |
著陸頁 |
| ??????????? <gameCategory>移動(dòng)游戲</gameCategory> |
可根據(jù)tag調(diào)整 |
| ??????????? <gameSubCategory>手機(jī)游戲</gameSubCategory> |
可根據(jù)tag調(diào)整 |
| ??????????? <description>《魔獸》(World of Warcraft)…</description> |
測(cè)試下來,站內(nèi)搜索展示前140個(gè)字符正好,如果沒有字符,別忘了要技術(shù)寫個(gè)判斷加上些類似“暫無介紹”的文字,不然會(huì)報(bào)錯(cuò) |
| ??????????? <image> |
|
| ??????????????? <name>*圖標(biāo)</name> |
可以是圖片的alt標(biāo)簽 |
| ??????????????? <url><![CDATA[http://xxxxx.xxx.jpg ]]> </url> |
游戲的展示圖片,例如手游的話是app圖標(biāo) |
| ??????????? </image> |
|
| ??????????? <datePublished>2011-12-20</datePublished> |
游戲的發(fā)布時(shí)間 |
| ??????????? <size>*MB</size> |
游戲大小 |
| ??????????? <tag>RPG,射擊</tag> |
游戲類型,這個(gè)可以根據(jù)站點(diǎn)的tag標(biāo)簽調(diào)整 |
| ??????????? <developer><legalName>*</legalName></developer> |
開發(fā)商 |
| ??????????? <version>V2.4.0</version> |
版本號(hào) |
| ??????????? <device>*</device> |
設(shè)備類型 |
| ??????? </data> |
|
| ??? </url> |
|
| </urlset> |
|
| <downloadUrl><![CDATA[ http://www.wowchina.com]]></downloadUrl> |
地址,有的話放上去,不是必填項(xiàng) |
其他注意點(diǎn):整個(gè)文檔要字符串形式, 這種需要轉(zhuǎn)義,自己注意。文件量太大的話用sitemapindex索引的xml。提交后很快能在百度站內(nèi)搜索中看到結(jié)果。
? 這部分需要到樣式自定義里面去把游戲樣式調(diào)用出來。
? 2、通用模板樣式
| <?xml version=”1.0″ encoding=”UTF-8″?> |
備注 |
| <urlset> |
|
| ??? <url> |
|
|
| ??????? <loc>http://ky.kaoyan.com/04/467393/</loc> |
|
著陸頁 |
| ??????? <lastmod>2013-04-10</lastmod> |
|
更新時(shí)間 |
| ??????? <changefreq>always</changefreq> |
|
更新平率 |
| ??????? <priority>0.5</priority> |
|
重要值 |
| ??????? <data> |
|
|
| ??????????? <display> |
|
|
| ??????????????? <title>【寫給即將上戰(zhàn)場(chǎng)的你們】努力為王,心態(tài)為皇</title> |
|
文章標(biāo)題,建議用頁面的title格式 |
| ??????????????? <content>略</content> |
|
可以全部提交正文,不用等蜘蛛來抓取了,注意把圖片格式,鏈接格式全部去掉 |
| ??????????????? <tag>考研復(fù)習(xí)</tag><tag>經(jīng)驗(yàn)</tag> |
|
根據(jù)tag標(biāo)簽 |
| ??????????????? <pubTime>2012-12-04T11:20:13</pubTime> |
|
發(fā)布時(shí)間 |
| ??????????????? <breadCrumb title=”考研加油站” url=”http://ky.kaoyan.com/”/> |
|
相當(dāng)于面包屑的層級(jí)關(guān)系 |
| ??????????????? <breadCrumb title=”考研政治” url=”http://www.kaoyan.com/s/zhengzhi”/> |
|
| ??????????????? <thumbnail loc=”http://docs.kaoyan.com/jpg/12/1204dde3cd949ccc.jpg”/> |
|
縮略圖 |
| ??????????????? <image loc=”http://docs.kaoyan.com/jpg/12/12048543278e760d.jpg” title=”七個(gè)常用的泰勒展開式”/> |
|
文章的個(gè)圖片,默認(rèn)缺省的話會(huì)調(diào)用縮略圖 |
| ??????????? </display> |
|
|
| ??????? </data> |
|
|
| ??? </url> |
|
|
| </urlset> |
|
下圖是通用模板的自定義結(jié)構(gòu)化因子,可以增加展示整個(gè)通用模板里還有很多其他的信息。在其中還可以看到比如discount(折扣);price(價(jià)格)等影響的因素。有興趣的可以去研究整個(gè)通用模板的數(shù)據(jù)結(jié)果,都包含在里面。
下圖的面包屑的層級(jí)是用breadcrumb:title這個(gè)結(jié)構(gòu)因子產(chǎn)生出來的。并且終還可以根據(jù)你的這些標(biāo)簽(比如price)進(jìn)行排序。 
說說重點(diǎn)的地方: 1、希望哪,這些提交的內(nèi)容能在百度搜索引擎(不是自己的站內(nèi))結(jié)果展示上有一定的區(qū)別。
2、貌似阿拉丁百度開放平臺(tái)里提交的數(shù)據(jù)和這個(gè)有些像,之后研究下,可以的話提交行業(yè)數(shù)據(jù)試試。
推薦閱讀