圖像分割是將圖像分割成多個不同區(qū)域(或片段)的過程。目標(biāo)是將圖像的表示變成更容易和更有意義的圖像。
在這篇博客中,我們將看到一種圖像分割方法,即K-Means Clustering。
K-Means 聚類是一種無監(jiān)督機(jī)器學(xué)習(xí)算法,旨在將N 個觀測值劃分為K 個聚類,其中每個觀測值都屬于具有最近均值的聚類。集群是指由于某些相似性而聚合在一起的數(shù)據(jù)點(diǎn)的集合。對于圖像分割,這里的簇是不同的圖像顏色。
我們使用的環(huán)境是pip install opencv-python numpy matplotlib
選擇的圖片是我們學(xué)校畢業(yè)照的圖片,放心這里沒有我,在學(xué)校公眾號找的美圖。
導(dǎo)入所需模塊:
import cv2 import numpy as np import matplotlib.pyplot as plt # read the image image = cv2.imread("Graduation.jpg")
在進(jìn)行圖像分割之前,讓我們將圖像轉(zhuǎn)換為RGB格式:
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
我們將使用cv2.kmeans()函數(shù),它將一個2D數(shù)組作為輸入,并且由于我們的原始圖像是3D(寬度、高度和深度為3 個 RGB值),我們需要將高度和寬度展平為單個像素向量(3 個 RGB值):
# 將圖像重塑為像素和3個顏色值(RGB)的2D數(shù)組 print(image.shape) #(853, 1280, 3) pixel_values = image.reshape((-1, 3)) # 轉(zhuǎn)換為numpy的float32 pixel_values = np.float32(pixel_values) print(pixel_values.shape) #(1091840, 3)
關(guān)于opencv下的kmean算法,函數(shù)為cv2.kmeans()
函數(shù)的格式為:kmeans(data, K, bestLabels, criteria, attempts, flags)
data: 分類數(shù)據(jù),最好是np.float32的數(shù)據(jù),每個特征放一列。之所以是np.float32原因是這種數(shù)據(jù)類型運(yùn)算速度快,如果是uint型數(shù)據(jù)將會很慢。
K: 分類數(shù),opencv2的kmeans分類是需要已知分類數(shù)的。
bestLabels:預(yù)設(shè)的分類標(biāo)簽:沒有的話 None
criteria:迭代停止的模式選擇,這是一個含有三個元素的元組型數(shù)。格式為(type,max_iter,epsilon)
,max_iter
迭代次數(shù),epsilon
結(jié)果的精確性
其中,type又有三種選擇:
flags:初始類中心選擇,兩種方法
cv2.KMEANS_PP_CENTERS
算法kmeans++的center; cv2.KMEANS_RANDOM_CENTERS
隨機(jī)初始化
在這里,我們需要設(shè)置criteria
確定停止標(biāo)準(zhǔn)。我們將在超過某些迭代次數(shù)(例如500)時停止,或者如果集群移動小于某個 epsilon 值(讓我們在這里選擇0.1),下面的代碼在OpenCV 中定義了這個停止標(biāo)準(zhǔn):
# 確定停止標(biāo)準(zhǔn) criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 500, 0.1)
上面圖像,會發(fā)現(xiàn)五種主要顏色(分別是天空、草地、樹、人的上身白,人的下身黑)
因此,我們將為這張圖片使用K=5:
k = 5 _, labels, (centers) = cv2.kmeans(pixel_values, k, None, criteria, 10, cv2.KMEANS_RANDOM_CENTERS)
cv2.KMEANS_RANDOM_CENTERS只是指示OpenCV最初隨機(jī)分配集群的值。
我們將扁平化的圖像像素值轉(zhuǎn)換為浮點(diǎn)數(shù)32類型,是因?yàn)閏v2.kmeans() 浮點(diǎn)數(shù)32類型,然后,讓我們將浮點(diǎn)數(shù)轉(zhuǎn)換回8 位像素值np.uint8(centers)
:
# 轉(zhuǎn)換回np.uint8 centers = np.uint8(centers) # 展平標(biāo)簽陣列 labels = labels.flatten() segmented_image = centers[labels.flatten()]
轉(zhuǎn)換回原始圖像形狀并顯示:
#重塑回原始圖像尺寸 segmented_image = segmented_image.reshape(image.shape) plt.imshow(segmented_image) plt.show()
當(dāng)然,我們還可以禁用圖像中的一些K-Means 聚類集群。例如,讓我們禁用集群編號1并顯示圖像:
# 禁用2號群集(將像素變?yōu)楹谏? masked_image = np.copy(segmented_image) # 轉(zhuǎn)換為像素值向量的形狀 masked_image = masked_image.reshape((-1, 3)) cluster1 = 1 masked_image[labels == cluster1] = [0, 0, 0] # 轉(zhuǎn)換回原始形狀 masked_image = masked_image.reshape(image.shape) plt.imshow(masked_image) plt.show()
原來K-Means 聚類2 號集群 是樹。
請注意,還有其他分割技術(shù),例如霍夫變換、輪廓檢測和當(dāng)前最先進(jìn)的語義分割。
到此這篇關(guān)于Python使用OpenCV和K-Means聚類對畢業(yè)照進(jìn)行圖像分割的文章就介紹到這了,更多相關(guān)OpenCV和K-Means圖像分割內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
標(biāo)簽:聊城 迪慶 撫州 南寧 六盤水 牡丹江 楊凌 揚(yáng)州
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python使用OpenCV和K-Means聚類對畢業(yè)照進(jìn)行圖像分割》,本文關(guān)鍵詞 Python,使用,OpenCV,和,K-Means,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。