亞馬遜賣家如何對數(shù)據(jù)清洗
在第三方采集器完成抓取后,對原有數(shù)據(jù)進(jìn)行下載,得到表格,最終需要的數(shù)據(jù)是鏈接父ASIN、鏈接上架時間、大類目排名這3列數(shù)據(jù)。
此時需要提取字段6中的大類目排名,即#之后的內(nèi)容,可以使用 Excel的分列功能完成該操作。
首先將排名后的大類目替換為#,此處為服裝類目,即“in Clothing,Shoes &Jewelry”。
其次,選擇Excel中的數(shù)據(jù),單擊“分列”按鈕,選中“分隔符號”單選按鈕,單擊下一步按鈕。
在“文本分列向?qū)б坏?步,共3步”對話框中設(shè)置分隔符號,勾選“其他”復(fù)選框,并輸入#,可以看到在數(shù)據(jù)預(yù)覽中,排名數(shù)據(jù)已經(jīng)被單獨分隔出來。
單擊“下一步”按鈕并完成分列,刪除其他列的數(shù)據(jù)即可。
此時仍有少數(shù)數(shù)據(jù)處于“Sports & Outdoors”戶外類目中未被分列,為確保數(shù)據(jù)對比的一致性,可刪除此類鏈接,或在新表格中進(jìn)行分析。
新建表格(對應(yīng)名為“A關(guān)鍵詞選品”的Excel表格,請根據(jù)學(xué)習(xí)需求下載查看),前三列分別登記抓取日期、ASIN、上架時間,第一行為抓取日期的鏈接排名。
將每天抓取到的數(shù)據(jù)對應(yīng)填入該表格中,即可整理出“tunic tops folwomen”關(guān)鍵詞搜索下多數(shù)產(chǎn)品的排名變化趨勢。
由于數(shù)據(jù)量可達(dá)到上萬條,普通手動查找將十分煩瑣,因此可以使用vlookup函數(shù),將每天抓取的數(shù)據(jù)匹配至表格中。
具體操作如下:首先在對應(yīng)日期的單元格中輸入“=vlookup(”,Excel將提示4個參數(shù)。
第一個參數(shù)為要引用的數(shù)據(jù),此處可直接選中對應(yīng)的ASIN,也可輸入“B2”,并輸入“,”,注意,這是英文逗號而非中文輸入法的逗號。
第二個參數(shù)為查找的范圍,打開抓取到的數(shù)據(jù),選中ASIN和排名列,函數(shù)查找時將按照ASIN列進(jìn)行匹配。
第三個參數(shù)為查找數(shù)據(jù)的序號,注意,這里的列數(shù)不是Bxcel默認(rèn)的列數(shù),而是查找范圍的第幾列。
此處排名是選中區(qū)域的第2列,故輸入“2”,最終查找時即可匹配到排名列數(shù)據(jù)。
第四個參數(shù)是選擇匹配類型,因為需要精確查找排名,所以輸入“FALSE”或者“0”。
模糊查找輸入“TURE”或“1”。
最后補全右括號“)”,得到公式“=VLOOKUP(B2,部分抓取數(shù)據(jù)!E:F,2,0)”。
向下填充其他單元格,最終即可獲得表格。
1 鏈接排名存在周期性波動,周三周四高峰,周末低谷,與運營經(jīng)驗相符合。
2 即使是排名較前的鏈接,也不一定每天都出現(xiàn)在關(guān)鍵詞搜索排名下。
考慮到鏈接周期性變化以及數(shù)據(jù)抓取延遲的因素,可以以7天為周期,取2個周期內(nèi)的數(shù)據(jù)進(jìn)行對比分析,后期運營者也可以選取多個周期進(jìn)行綜合對比。
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點和立場。
轉(zhuǎn)載請注明,如有侵權(quán),聯(lián)系刪除。