欧美free性护士vide0shd,老熟女,一区二区三区,久久久久夜夜夜精品国产,久久久久久综合网天天,欧美成人护士h版

首頁綜合 正文
目錄

柚子快報邀請碼778899分享:基于Kmeans算法的城市聚類

柚子快報邀請碼778899分享:基于Kmeans算法的城市聚類

http://yzkb.51969.com/

目錄

一、 背景

二、 設(shè)計平臺及技術(shù)理論

2.1.設(shè)計平臺——Jupyter Notebook

2.1.1?交互性:

2.1.2可視化:

2.1.3文檔性:

2.1.4多語言支持:

2.1.5方便分享:

2.1.6生態(tài)系統(tǒng)豐富:

2.2.技術(shù)理論

2.2.1kmeans算法

2.2.2算法缺陷

2.2.3算法改進

2.2.2Python庫的使用

2.2.3.1 Numpy

2.2.3.2 Pandas

2.2.3.3 Matplotlib

2.2.3.3.4Matplotlib

三、 前期準(zhǔn)備

3.1導(dǎo)入所需Python庫

3.2獲取API使用權(quán)限

四、 實際操作

五、 總結(jié)

背景

現(xiàn)在旅游業(yè)蓬勃發(fā)展,人們經(jīng)常出行旅游感受祖國大好風(fēng)光,那么如何最短距離的有規(guī)劃性的選擇目的地以及周邊地區(qū)進行旅游,是各大旅游商們需要解決的問題。機器學(xué)習(xí)中通過Kmeans算法可以有效地將城市進行聚類,從而給出一定范圍內(nèi)最適合的旅游地點進行推送。

KMeans聚類算法是一種非層次聚類算法,在最小誤差的基礎(chǔ)上將數(shù)據(jù)劃分了特定的類,類間利用距離作為相似度指標(biāo),兩個向量之間的距離越小,其相似度就越高。

先假定有游客想要選擇來新疆旅游,但他對新疆不太了解,已知新疆各城市的城市名,要求利用經(jīng)緯度坐標(biāo)進行KMeans聚類分析。

因為kmeans是無監(jiān)督學(xué)習(xí)中一種聚類算法,換句話說:喂給該算法模型都是無label的數(shù)據(jù),雜亂無章,而本實驗采用的數(shù)據(jù)集沒有l(wèi)abel所以本實驗采用kmeans算法。

設(shè)計平臺及技術(shù)理論

2.1.設(shè)計平臺——Jupyter Notebook

2.1.1?交互性:

Jupyter Notebook提供了交互式的編程環(huán)境,可以即時運行代碼并查看結(jié)果,方便調(diào)試和實時反饋。

2.1.2可視化:

Jupyter Notebook支持豐富的數(shù)據(jù)可視化功能,可以直接在Notebook中展示圖表、圖片、動畫等,便于數(shù)據(jù)分析和展示。

2.1.3文檔性:

Jupyter Notebook可以直接嵌入文本、公式、圖表等內(nèi)容,方便編寫和分享代碼文檔,適合教學(xué)、報告和研究。

2.1.4多語言支持:

Jupyter Notebook支持多種編程語言,包括Python、R、Julia等,可以在同一個Notebook中混合使用不同語言編寫代碼。

2.1.5方便分享:

Jupyter Notebook可以導(dǎo)出為HTML、PDF、Markdown等格式,方便分享和展示成果。

2.1.6生態(tài)系統(tǒng)豐富:

Jupyter Notebook有豐富的擴展和插件,可以滿足不同需求,例如數(shù)據(jù)處理、機器學(xué)習(xí)、深度學(xué)習(xí)等。

總之,Jupyter Notebook具有交互性強、可視化豐富、文檔性好、多語言支持等優(yōu)點,適合數(shù)據(jù)分析、科學(xué)計算和教學(xué)等領(lǐng)域的使用。

2.2.技術(shù)理論

2.2.1kmeans算法

K-Means聚類算法是一種基于向量距離作為相似性的評價指標(biāo),即認(rèn)為兩個對象的距離越近,其相似度就越大。該算法認(rèn)為類簇是由距離靠近的對象組成的,因此它把得到緊湊且獨立的類簇作為聚類的最終目標(biāo)。

綜上所述,K-Means算法劃分的k個聚類具有以下特點:各聚類內(nèi)部的元素盡可能的緊湊,而各聚類之間的元素盡可能的分開

K-Means算法的基礎(chǔ)是最小誤差平方和準(zhǔn)則,K-Means算法具體流程如下:

(1)從n個樣本對象任意選擇k個對象作為初始聚類中心;

(2)根據(jù)在步驟 (1) 中設(shè)置的k個聚類中心,計算每個對象與這k個中心的距離;

(3)經(jīng)過步驟 (2) 的計算,所有對象與這個k個中心的距離就計算出來了,接著把所有對象與離它最近的中心歸在一個類簇中;

(4)重新計算每個類簇的中心對象的位置;

(5)重復(fù)步驟 (3) 和 (4),直到類簇聚類方案中的對象歸類幾乎不發(fā)生變化為止。

2.2.2算法缺陷

(1)種子點的個數(shù)要事先確定,但是我們一般很難估計它的個數(shù)。

(2)K-Means算法需要初始種子點,并且隨機種子會影響計算結(jié)果。

(3)需要不斷地計算調(diào)整后的類簇中心,當(dāng)數(shù)據(jù)量很大時,這個計算所需的時間就會很大。

2.2.3算法改進

K-Means++算法是改進后的K-Means算法,具體算法流程如下:

(1)從數(shù)據(jù)集的點中隨機選擇一個點作為種子點;

(2)計算數(shù)據(jù)集中的每一個點到種子點的距離D(x);

(3)選擇D(x)較大的點作為新的種子點;

(4)重復(fù)步驟 (2) 和 (3)直到新的種子被選出來。

2.2.2Python庫的使用

2.2.3.1?Numpy

NumPy是一個用于數(shù)值計算的Python庫,它提供了多維數(shù)組對象和用于處理數(shù)組的各種函數(shù)。NumPy還提供了大量的數(shù)學(xué)函數(shù),用于線性代數(shù)、傅立葉變換、隨機數(shù)生成等。由于NumPy的數(shù)組運算速度快且內(nèi)存占用低,因此它被廣泛應(yīng)用于科學(xué)計算、數(shù)據(jù)分析、機器學(xué)習(xí)等領(lǐng)域。因此NumPy是Python數(shù)據(jù)科學(xué)生態(tài)系統(tǒng)中不可或缺的部分,為處理大規(guī)模數(shù)據(jù)和進行復(fù)雜計算提供了強大的支持。

2.2.3.2 Pandas

Pandas 是一個基于 Python 的數(shù)據(jù)分析庫,提供了快速、靈活、簡單的數(shù)據(jù)結(jié)構(gòu),使數(shù)據(jù)操作更為便捷。Pandas 提供了許多功能,包括數(shù)據(jù)清洗、數(shù)據(jù)重塑、切片和索引、合并和連接、時間序列分析等。它廣泛應(yīng)用于數(shù)據(jù)科學(xué)、機器學(xué)習(xí)、金融分析等領(lǐng)域。Pandas 的靈活性和強大功能使得它成為數(shù)據(jù)分析領(lǐng)域的重要工具之一。

2.2.3.3 Matplotlib

Matplotlib是一個用于創(chuàng)建靜態(tài)、交互式和動態(tài)可視化的Python庫。Matplotlib可以創(chuàng)建折線圖、散點圖、直方圖、餅圖、等高線圖、3D圖等多種類型的圖表。它還支持自定義圖表的樣式、顏色、標(biāo)簽和圖例等元素,使用戶能夠創(chuàng)建具有吸引力和信息豐富的圖表。同時Matplotlib還與許多其他Python庫和工具集成,如NumPy、Pandas等,使用戶能夠輕松地將數(shù)據(jù)導(dǎo)入到圖表中,并進行數(shù)據(jù)分析和可視化。Matplotlib是一個功能強大且靈活的可視化工具,適用于各種數(shù)據(jù)分析和可視化需求。

2.2.3.3.4Matplotlib

scikit-learn,又寫作sklearn,是一個開源的基于python語言的機器學(xué)習(xí)工具包。它通過NumPy, SciPy和Matplotlib等python數(shù)值計算的庫實現(xiàn)高效的算法應(yīng)用,并且涵蓋了幾乎所有主流機器學(xué)習(xí)算法。

前期準(zhǔn)備

3.1導(dǎo)入所需Python庫

?

3.2獲取API使用權(quán)限

進入官網(wǎng)–>騰訊地圖

進入開發(fā)文檔–>地址坐標(biāo)相互轉(zhuǎn)換

文檔中請求鏈接,請求參數(shù),返回參數(shù)都很清晰,這里直接把調(diào)用代碼寫上來。

(開發(fā)者需要先注冊獲取API使用權(quán)限)

實際操作

4.1通過騰訊地圖將給定的一組數(shù)據(jù)集進行城市名轉(zhuǎn)化為經(jīng)緯度,這里給出八個新疆地區(qū)的城市名,計算后得到它們的經(jīng)緯度坐標(biāo)

4.2將得到的經(jīng)緯度進行數(shù)據(jù)處理并進行歐幾里得距離計算,求每個點之間的距離

4.3初始化質(zhì)心的矩陣并隨機給出質(zhì)心

4.4這里實現(xiàn)了k-means聚類算法的Python函數(shù)。k-means是一種非常常見的無監(jiān)督學(xué)習(xí)方法,用于將數(shù)據(jù)集劃分為k個集群。并且構(gòu)建出模型

4.5這里將給出的Kmeans聚類結(jié)果進行繪制

4.6第一個數(shù)據(jù)集給出后,Kmeans算法結(jié)果

第4.7第二次次數(shù)據(jù)集給出25個城市名后,通過生成的模型給出的結(jié)果

4.8將得到的經(jīng)緯度進行數(shù)據(jù)處理并進行歐幾里得距離計算,求每個點之間的最短距離

通過Kmeans算法進行聚類,給定K 值,標(biāo)記樣式,給定顏色,并且將得到的結(jié)果進行可視化

這里是將新疆部分城市名轉(zhuǎn)化經(jīng)緯度坐標(biāo)后通過Kmeans算法聚類后得到的可視化圖形

給定K值為3

通訓(xùn)練集過多次聚類

取較為穩(wěn)定的圖形展示

柚子快報邀請碼778899分享:基于Kmeans算法的城市聚類

http://yzkb.51969.com/

參考文章

評論可見,查看隱藏內(nèi)容

本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點和立場。

轉(zhuǎn)載請注明,如有侵權(quán),聯(lián)系刪除。

本文鏈接:http://m.gantiao.com.cn/post/19082946.html

發(fā)布評論

您暫未設(shè)置收款碼

請在主題配置——文章設(shè)置里上傳

掃描二維碼手機訪問

文章目錄