圖像分割是將圖像分割成多個不同區(qū)域(或片段)的過程。目標是將圖像的表示變成更容易和更有意義的圖像。
在這篇博客中,我們將看到一種圖像分割方法,即K-Means Clustering。
K-Means 聚類是一種無監(jiān)督機器學習算法,旨在將N 個觀測值劃分為K 個聚類,其中每個觀測值都屬于具有最近均值的聚類。集群是指由于某些相似性而聚合在一起的數(shù)據(jù)點的集合。對于圖像分割,這里的簇是不同的圖像顏色。
我們使用的環(huán)境是pip install opencv-python numpy matplotlib
選擇的圖片是我們學校畢業(yè)照的圖片,放心這里沒有我,在學校公眾號找的美圖。
導入所需模塊:
import cv2
import numpy as np
import matplotlib.pyplot as plt
# read the image
image = cv2.imread("Graduation.jpg")
在進行圖像分割之前,讓我們將圖像轉(zhuǎn)換為RGB格式:
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
我們將使用cv2.kmeans()函數(shù),它將一個2D數(shù)組作為輸入,并且由于我們的原始圖像是3D(寬度、高度和深度為3 個 RGB值),我們需要將高度和寬度展平為單個像素向量(3 個 RGB值):
# 將圖像重塑為像素和3個顏色值(RGB)的2D數(shù)組
print(image.shape) #(853, 1280, 3)
pixel_values = image.reshape((-1, 3))
# 轉(zhuǎn)換為numpy的float32
pixel_values = np.float32(pixel_values)
print(pixel_values.shape) #(1091840, 3)
關(guān)于opencv下的kmean算法,函數(shù)為cv2.kmeans()
函數(shù)的格式為:kmeans(data, K, bestLabels, criteria, attempts, flags)
data: 分類數(shù)據(jù),最好是np.float32的數(shù)據(jù),每個特征放一列。之所以是np.float32原因是這種數(shù)據(jù)類型運算速度快,如果是uint型數(shù)據(jù)將會很慢。
K: 分類數(shù),opencv2的kmeans分類是需要已知分類數(shù)的。
bestLabels:預(yù)設(shè)的分類標簽:沒有的話 None
criteria:迭代停止的模式選擇,這是一個含有三個元素的元組型數(shù)。格式為(type,max_iter,epsilon)
,max_iter
迭代次數(shù),epsilon
結(jié)果的精確性
其中,type又有三種選擇:
- cv2.TERM_CRITERIA_EPS :精確度(誤差)滿足epsilon停止。
- cv2.TERM_CRITERIA_MAX_ITER:迭代次數(shù)超過max_iter停止
- cv2.TERM_CRITERIA_EPS+cv2.TERM_CRITERIA_MAX_ITER,兩者合體,任意一個滿足結(jié)束。
- - attempts:重復(fù)試驗kmeans算法次數(shù),將會返回最好的一次結(jié)果
flags:初始類中心選擇,兩種方法
cv2.KMEANS_PP_CENTERS
算法kmeans++的center; cv2.KMEANS_RANDOM_CENTERS
隨機初始化
在這里,我們需要設(shè)置criteria
確定停止標準。我們將在超過某些迭代次數(shù)(例如500)時停止,或者如果集群移動小于某個 epsilon 值(讓我們在這里選擇0.1),下面的代碼在OpenCV 中定義了這個停止標準:
# 確定停止標準
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 500, 0.1)
上面圖像,會發(fā)現(xiàn)五種主要顏色(分別是天空、草地、樹、人的上身白,人的下身黑)
因此,我們將為這張圖片使用K=5:
k = 5
_, labels, (centers) = cv2.kmeans(pixel_values, k, None, criteria, 10, cv2.KMEANS_RANDOM_CENTERS)
cv2.KMEANS_RANDOM_CENTERS只是指示OpenCV最初隨機分配集群的值。
我們將扁平化的圖像像素值轉(zhuǎn)換為浮點數(shù)32類型,是因為cv2.kmeans() 浮點數(shù)32類型,然后,讓我們將浮點數(shù)轉(zhuǎn)換回8 位像素值np.uint8(centers)
:
# 轉(zhuǎn)換回np.uint8
centers = np.uint8(centers)
# 展平標簽陣列
labels = labels.flatten()
segmented_image = centers[labels.flatten()]
轉(zhuǎn)換回原始圖像形狀并顯示:
#重塑回原始圖像尺寸
segmented_image = segmented_image.reshape(image.shape)
plt.imshow(segmented_image)
plt.show()
當然,我們還可以禁用圖像中的一些K-Means 聚類集群。例如,讓我們禁用集群編號1并顯示圖像:
# 禁用2號群集(將像素變?yōu)楹谏?
masked_image = np.copy(segmented_image)
# 轉(zhuǎn)換為像素值向量的形狀
masked_image = masked_image.reshape((-1, 3))
cluster1 = 1
masked_image[labels == cluster1] = [0, 0, 0]
# 轉(zhuǎn)換回原始形狀
masked_image = masked_image.reshape(image.shape)
plt.imshow(masked_image)
plt.show()
原來K-Means 聚類2 號集群 是樹。
請注意,還有其他分割技術(shù),例如霍夫變換、輪廓檢測和當前最先進的語義分割。
到此這篇關(guān)于Python使用OpenCV和K-Means聚類對畢業(yè)照進行圖像分割的文章就介紹到這了,更多相關(guān)OpenCV和K-Means圖像分割內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- 基于OpenCV實現(xiàn)圖像分割
- C++中實現(xiàn)OpenCV圖像分割與分水嶺算法
- python+opencv圖像分割實現(xiàn)分割不規(guī)則ROI區(qū)域方法匯總
- python用opencv完成圖像分割并進行目標物的提取
- Opencv實現(xiàn)用于圖像分割分水嶺算法
- OpenCV圖像分割中的分水嶺算法原理與應(yīng)用詳解
- openCV實現(xiàn)圖像分割