柚子快報邀請碼778899分享:【數據挖掘-思考】分類和聚類
AsosMarketplace時尚出海市綜合2025-05-05440
柚子快報邀請碼778899分享:【數據挖掘-思考】分類和聚類
將芝麻和花生分開,是一個分類問題還是聚類問題?
顯而易見的,在日常生活中,這是一個分類問題,在數據挖掘領域中,是否也是這樣呢?
通義千問的回答:
在數據挖掘中,將芝麻和花生分開可以根據不同的場景被視為分類或聚類問題:
分類 (Classification): 如果我們已經有了一套標注好的數據集,即一部分芝麻已經被標記為“芝麻”,一部分綠豆被標記為“綠豆”,并且我們的目標是基于這些已知的樣本特征來訓練一個模型,以便對新的未標記物品進行預測(判斷它是芝麻還是綠豆),那么這個問題就是一個分類問題。聚類 (Clustering): 如果我們沒有預先標記的數據,而是有一堆混在一起的種子,我們希望通過分析種子的大小、顏色、形狀等屬性,將它們自動分成幾組,并且假設這些組能合理地對應到芝麻和綠豆這兩類,那么這就是一個聚類問題。聚類旨在根據對象之間的相似性或距離,將它們分組成多個簇,每簇內部的對象相似度較高,而簇間相似度較低。因此,決定這是分類還是聚類問題的關鍵在于是否有預定義的類別標簽。如果有標簽,就是分類;如果沒有,而是需要自動發(fā)現類別,那就是聚類。
這樣學術性的回答好復雜>﹏<
我的老師教給我的:
也就是說,需要訓練數據,構建模型的問題是分類問題,很顯然這里沒有用到,所以是聚類問題。聚類問題關鍵在于根據某種標準將相似度高的對象分到一起。
你能理解嗎?
點贊關注收藏,獲取更多干貨知識~
柚子快報邀請碼778899分享:【數據挖掘-思考】分類和聚類
精彩文章
評論可見,查看隱藏內容
本文內容根據網絡資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點和立場。
轉載請注明,如有侵權,聯系刪除。