亞馬遜運(yùn)營(yíng)之?dāng)?shù)據(jù)“清洗”
有數(shù)據(jù)分析經(jīng)驗(yàn)的運(yùn)營(yíng)者都知道,獲取的第一手?jǐn)?shù)據(jù)一般是無(wú)法直接進(jìn)行分析的,這時(shí)就需要對(duì)數(shù)據(jù)進(jìn)行“清洗”。
人工采集的數(shù)據(jù)一般不需要“清洗”,因?yàn)檫\(yùn)營(yíng)者在人工采集時(shí)會(huì)對(duì)數(shù)據(jù)做一個(gè)篩選,數(shù)據(jù)采集結(jié)束以后可以直接對(duì)獲取的數(shù)據(jù)進(jìn)行分析和判斷。
運(yùn)營(yíng)者需要結(jié)合特定的分析目的對(duì)報(bào)表采集的數(shù)據(jù)進(jìn)行“清洗”。
例如,在運(yùn)營(yíng)者進(jìn)行用戶購(gòu)物習(xí)慣分析時(shí),最關(guān)鍵的數(shù)據(jù)就是訂單報(bào)表中的訂單時(shí)間數(shù)據(jù)。
初始的訂單數(shù)據(jù)為“2019-03-29T16:34:49-07:00”T之前的數(shù)據(jù)是日期, T之后的數(shù)據(jù)是下單時(shí)間。
如果要做用戶畫(huà)像分析,運(yùn)營(yíng)者需要的是數(shù)據(jù)中的訂單小時(shí)時(shí)間即“16:34:49”中的“16”那么就需要對(duì)這些數(shù)據(jù)進(jìn)行“清洗”。
我們首先打開(kāi)電子文檔中的“4.2.3數(shù)據(jù)清洗”Excel文件,然后使用Excel軟件中自帶的“MID”函數(shù)在“2019-03-29T16:34:49-07:00”數(shù)據(jù)中從第12位起取2個(gè)數(shù)字,就是最終需要的時(shí)間“16”。
已經(jīng)完成了數(shù)據(jù)“清洗”工作,讀者只需要將“清洗”內(nèi)容刪除再重新操作一遍即可。
除了對(duì)時(shí)間數(shù)據(jù)進(jìn)行“清洗”,運(yùn)營(yíng)者還可能對(duì)地理數(shù)據(jù)或其他訂單數(shù)據(jù)進(jìn)行“清洗”其處理方式和時(shí)間數(shù)據(jù)處理方式大同小異。
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。
轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。