欧美日韩在线免费播放一二三区,有人有在线观看的片吗www

使用 CNN 進(jìn)行面部情緒識別

2023-05-18 13:44

面部表情是人類之間交流的重要方式。

在人工智能研究中，深度學(xué)習(xí)技術(shù)已成為增強(qiáng)人機(jī)交互的強(qiáng)大工具。心理學(xué)中面部表情和情緒的分析和評估涉及評估預(yù)測個(gè)人或群體情緒的決定。

本研究旨在開發(fā)一種能夠使用卷積神經(jīng)網(wǎng)絡(luò)（CNN）算法和特征提取技術(shù)預(yù)測和分類面部情緒的系統(tǒng)。

該過程包括三個(gè)主要階段：數(shù)據(jù)預(yù)處理、面部特征提取和面部情緒分類。通過采用卷積神經(jīng)網(wǎng)絡(luò)（CNN）算法，系統(tǒng)準(zhǔn)確預(yù)測面部表情，成功率為62.66%。

該算法的性能使用FER2013數(shù)據(jù)庫進(jìn)行評估，該數(shù)據(jù)庫是一個(gè)公開可用的數(shù)據(jù)集，包含35，887張48x48灰度面部圖像，每張圖像代表一種不同的情緒。

現(xiàn)在讓我們從編碼開始。

!pip install scikit-plot

此代碼使用 pip 安裝 scikit-plot 包，pip 是一個(gè) Python 包，提供了一系列有用的工具來可視化機(jī)器學(xué)習(xí)模型的性能。

具體來說，scikit-plot提供了多種函數(shù)來生成模型評估中使用的常見圖，例如ROC曲線，精度召回率曲線，混淆矩陣等。

在Python環(huán)境中執(zhí)行命令“！pip install scikit-plot”后，你應(yīng)該能夠在代碼中導(dǎo)入和使用scikit-plot函數(shù)。

import pandas as pd

import numpy as np

import scikitplot

import random

import seaborn as sns

import keras

import os

from matplotlib import pyplot

import matplotlib.pyplot as plt

import tensorflow as tf

from tensorflow.keras.utils import to_categorical

import warnings

from tensorflow.keras.models import Sequential

from keras.callbacks import EarlyStopping

from keras import regularizers

from keras.callbacks import ModelCheckpoint,EarlyStopping

from tensorflow.keras.optimizers import Adam,RMSprop,SGD,Adamax

from keras.preprocessing.image import ImageDataGenerator,load_img

from keras.utils.vis_utils import plot_model

from keras.layers import Conv2D, MaxPool2D, Flatten,Dense,Dropout,BatchNormalization,MaxPooling2D,Activation,Input

from sklearn.model_selection import train_test_split

from sklearn.preprocessing import StandardScaler

warnings.simplefilter("ignore")

from keras.models import Model

from sklearn.model_selection import train_test_split

from sklearn.metrics import accuracy_score

from keras.regularizers import l1, l2

import plotly.express as px

from matplotlib import pyplot as plt

from sklearn.metrics import confusion_matrix

from sklearn.metrics import classification_report

該代碼導(dǎo)入機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)中常用的各種 Python 庫和模塊。

這些庫包括pandas，numpy，scikit-plot，random，seaborn，keras，os，matplotlib，tensorflow和scikit-learn。

每個(gè) import 語句導(dǎo)入一組執(zhí)行機(jī)器學(xué)習(xí)或深度學(xué)習(xí)任務(wù)所需的特定工具或函數(shù)，例如數(shù)據(jù)操作、數(shù)據(jù)可視化、模型構(gòu)建和性能評估。

總體而言，此代碼準(zhǔn)備了執(zhí)行各種機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)（如數(shù)據(jù)預(yù)處理、模型訓(xùn)練和模型評估）所需的必要工具和模塊。

從這里下載代碼：http://onepagecode.s3-website-us-east-1.amazonaws.com/

加載數(shù)據(jù)集data = pd.read_csv("/input/fer2013/fer2013.csv")

data.shape

此代碼使用 pandas 的read_csv()函數(shù)讀取名為“fer2013.csv”的 CSV 文件，該文件位于“/input/fer2013/“ 目錄，并將生成的數(shù)據(jù)幀分配給名為data的變量。

然后，在數(shù)據(jù)幀上調(diào)用shape屬性以檢索其維度，這將返回表單的元組。這行代碼將輸出數(shù)據(jù)幀data中的行數(shù)和列數(shù)(rows, columns)。

data.isnull().sum()

此代碼將返回?cái)?shù)據(jù)幀data的每一列中所有缺失值的總和。

數(shù)據(jù)幀的isnull()方法返回一個(gè)布爾數(shù)據(jù)幀，該幀指示原始數(shù)據(jù)幀中的每個(gè)元素是否丟失。然后將sum()方法應(yīng)用于此布爾數(shù)據(jù)幀，該幀返回每列中缺失值的總和。

這是檢查數(shù)據(jù)幀中是否存在任何缺失值的快速方法。如果存在缺失值，則可能需要在將數(shù)據(jù)用于建模之前插補(bǔ)或刪除這些值。

data.head()

此代碼將返回?cái)?shù)據(jù)幀data的前 5 行。

數(shù)據(jù)幀的head()方法返回?cái)?shù)據(jù)幀的前n行（默認(rèn)情況下為n=5 ）。這是快速瀏覽數(shù)據(jù)幀中的數(shù)據(jù)的有用方法，尤其是在處理大型數(shù)據(jù)集時(shí)。

輸出將顯示數(shù)據(jù)幀data的前 5 行，其中可能包括列名稱和前幾行數(shù)據(jù)，具體取決于數(shù)據(jù)幀的結(jié)構(gòu)。

數(shù)據(jù)頭的輸出

數(shù)據(jù)預(yù)處理CLASS_LABELS = ['Anger', 'Disgust', 'Fear', 'Happy', 'Neutral', 'Sadness', "Surprise"]

fig = px.bar(x = CLASS_LABELS,

y = [list(data['emotion']).count(i) for i in np.unique(data['emotion'])] ,

color = np.unique(data['emotion']) ,

color_continuous_scale="Emrld")

fig.update_xaxes(title="Emotions")

fig.update_yaxes(title = "Number of Images")

fig.update_layout(showlegend = True,

title = {

'text': 'Train Data Distribution ',

'y':0.95,

'x':0.5,

'xanchor': 'center',

'yanchor': 'top'})

fig.show()

此代碼使用 Plotly Express 庫創(chuàng)建條形圖，該條形圖顯示數(shù)據(jù)幀data中情緒的分布。

首先，在CLASS_LABELS中定義一個(gè)類標(biāo)簽列表，它對應(yīng)于數(shù)據(jù)集中的不同情緒。

然后，調(diào)用px.bar()函數(shù)，其中 x 軸表示類標(biāo)簽，y 軸表示每個(gè)情緒的圖像數(shù)量。顏色參數(shù)設(shè)置為不同的情感類，color_continuous_scale參數(shù)設(shè)置為“Emrld”，這是 Plotly Express 中預(yù)定義的色階。

接下來，調(diào)用各種update_方法來修改繪圖的布局和外觀。例如，update_xaxes()和update_yaxes()用于分別設(shè)置 x 軸和 y 軸標(biāo)題。 update_layout()用于設(shè)置打印標(biāo)題及其位置。

最后，在圖形對象上調(diào)用show()方法以顯示繪圖。

輸出將顯示一個(gè)條形圖，該條形圖顯示數(shù)據(jù)幀data中每個(gè)情緒的圖像數(shù)，每個(gè)情緒根據(jù)指定的色階進(jìn)行顏色編碼。

隨機(jī)打亂數(shù)據(jù)data = data.sample(frac=1)

DataFrame 的sample()方法用于隨機(jī)采樣數(shù)據(jù)幀中行的一小部分，并指定frac要返回的行部分（在本例中為 frac=1，這意味著將返回所有行）。當(dāng)frac=1時(shí)，sample()方法有效地對數(shù)據(jù)幀中的行進(jìn)行洗牌。

這是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)中的常見操作，隨機(jī)打亂數(shù)據(jù)以防止在數(shù)據(jù)具有任何固有順序或結(jié)構(gòu)時(shí)可能引入的任何偏差非常重要。

One Hot編碼labels = to_categorical(data[['emotion']], num_classes=7)

輸出是一個(gè)形狀為(n_samples, n_classes)的 numpy 數(shù)組，其中：

n_samples是數(shù)據(jù)幀中的樣本數(shù)n_classes是數(shù)據(jù)中唯一類的數(shù)量（在本例中為 7）數(shù)組data的每一行表示數(shù)據(jù)幀中單個(gè)樣本的One Hot編碼標(biāo)簽。train_pixels = data["pixels"].astype(str).str.split(" ").tolist()

train_pixels = np.uint8(train_pixels)

此代碼對數(shù)據(jù)DataFrame的像素列中的像素值進(jìn)行預(yù)處理。

首先，astype()方法用于將pixels列轉(zhuǎn)換為字符串?dāng)?shù)據(jù)類型，這允許在列的每一行上調(diào)用split()方法。

接下來，對pixels列的每一行調(diào)用split()方法，以將像素值拆分為字符串列表。然后使用tolist()將生成的列表轉(zhuǎn)換為 numpy 數(shù)組。

最后，對 numpy 數(shù)組調(diào)用np.uint8()，將像素值從字符串轉(zhuǎn)換為無符號 8 位整數(shù)，這是通常用于表示圖像像素值的數(shù)據(jù)類型。

輸出是一個(gè)形狀為(n_samples, n_pixels)的 numpy 數(shù)組，其中n_samples是數(shù)據(jù)幀中的樣本數(shù)，n_pixels是數(shù)據(jù)中每個(gè)圖像的像素?cái)?shù)。數(shù)組data的每一行表示數(shù)據(jù)幀中單個(gè)圖像的像素值。

標(biāo)準(zhǔn)化pixels = train_pixels.reshape((35887*2304,1))

此代碼將train_pixels numpy數(shù)組從形狀的三維數(shù)組（n_samples，n_rows，n_columns）重新整形為形狀的二維數(shù)組（n_samples*n_row，1）。

numpy數(shù)組的reshape()方法用于更改其形狀。在這種情況下，train_pixels陣列通過將其重塑為具有一列的2D陣列而被展平。

得到的像素陣列的形狀為（n_samples*n_rows，1），其中n_samples是DataFrame中的樣本數(shù)，n_rows是每個(gè)圖像的行數(shù)，1 表示DataFrame中每個(gè)圖像的展平像素值。陣列的每一行表示DataFrame中單個(gè)圖像的單個(gè)像素值。

scaler = StandardScaler()

pixels = scaler.fit_transform(pixels)

此代碼使用scikit learn的StandardScaler()函數(shù)將標(biāo)準(zhǔn)化應(yīng)用于像素numpy數(shù)組。

StandardScaler()函數(shù)是一個(gè)預(yù)處理步驟，用于縮放數(shù)據(jù)的每個(gè)特征（在本例中為每個(gè)像素值），使其均值為 0，方差為 1。這是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)中常用的技術(shù)，可確保每個(gè)特征對模型的貢獻(xiàn)相同。

然后在像素numpy數(shù)組上調(diào)用StandardScaler()對象的fit_transform()方法，該方法計(jì)算數(shù)據(jù)的平均值和標(biāo)準(zhǔn)偏差，并相應(yīng)地縮放數(shù)據(jù)。然后將得到的縮放數(shù)據(jù)分配回像素numpy數(shù)組。

輸出是一個(gè)與原始pixels數(shù)組形狀相同的 numpy 數(shù)組，但每個(gè)像素值都已標(biāo)準(zhǔn)化。

重塑數(shù)據(jù) （48，48）pixels = train_pixels.reshape((35887, 48, 48,1))

此代碼將train_pixels numpy數(shù)組從2維形狀數(shù)組（n_samples*n_rows，1）重新整形為4維形狀陣列（n_samples，n_rows、n_columns、n_channels）。

numpy數(shù)組的reshape()方法用于更改其形狀。在這種情況下，train_pixels陣列被重塑為具有1個(gè)通道的4D陣列。

得到的像素陣列的形狀為（n_samples，n_rows，n_columns，n_channels），其中n_samples是DataFrame中的樣本數(shù)量，n_row是每個(gè)圖像的行數(shù)，n_column是每個(gè)圖像中的列數(shù)，n_channel表示每個(gè)圖像中顏色通道的數(shù)量。

由于原始數(shù)據(jù)集是灰度級的，因此n_channels設(shè)置為1。像素陣列的每個(gè)元素表示DataFrame中單個(gè)灰度圖像的像素值。

訓(xùn)練測試驗(yàn)證拆分

現(xiàn)在，我們有 35887 張圖像，每張圖像包含 48x48 像素。我們將數(shù)據(jù)拆分為訓(xùn)練、測試和驗(yàn)證數(shù)據(jù)，以 10% 的比例提供、評估和驗(yàn)證我們的數(shù)據(jù)。

X_train, X_test, y_train, y_test = train_test_split(pixels, labels, test_size=0.1, shuffle=False)

X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.1, shuffle=False)

該代碼使用scikit-learn的train_test_split()函數(shù)將經(jīng)過預(yù)處理的圖像數(shù)據(jù)像素和一個(gè)熱編碼的標(biāo)簽標(biāo)簽拆分為訓(xùn)練集、驗(yàn)證集和測試集。

函數(shù)train_test_split()根據(jù)test_size參數(shù)將數(shù)據(jù)隨機(jī)拆分為訓(xùn)練和測試子集，test_size指定應(yīng)用于測試的數(shù)據(jù)部分。在這種情況下，test_size=0.1，這意味著10%的數(shù)據(jù)將用于測試。

shuffle參數(shù)設(shè)置為False以保留DataFrame中樣本的原始順序。

生成的X_train、X_val和X_test數(shù)組分別包含訓(xùn)練集、驗(yàn)證集和測試集的像素值。y_train、y_val和y_test數(shù)組包含對應(yīng)集合的one hot編碼標(biāo)簽。

再次使用train_test_split()將訓(xùn)練集進(jìn)一步拆分為訓(xùn)練集和驗(yàn)證集，test_size=0.1。這將數(shù)據(jù)分成80%用于訓(xùn)練，10%用于驗(yàn)證，10%用于測試。

print(X_train.shape)

print(X_test.shape)

print(X_val.shape)

在將數(shù)據(jù)拆分為訓(xùn)練集、驗(yàn)證集和測試集之后，這些代碼行打印X_train、X_test和X_val數(shù)組的形狀。

numpy數(shù)組的shape屬性返回?cái)?shù)組維度的元組。在這種情況下，X_train、X_test和X_val數(shù)組的形狀將取決于每個(gè)集合中的樣本數(shù)量和每個(gè)樣本的維度。

輸出將以格式（n_samples、n_rows、n_columns、n_channel）顯示陣列的形狀，其中n_samples是集合中的樣本數(shù)，n_rows是每個(gè)圖像的行數(shù)，n_columns是每個(gè)圖像中的列數(shù)，n_channel表示每個(gè)圖像中顏色通道的數(shù)量。

在這個(gè)繪圖代碼的幫助下，我們可以看到一些包含每個(gè)類的一個(gè)樣本的訓(xùn)練數(shù)據(jù)。

plt.figure(figsize=(15,23))

label_dict = {0 : 'Angry', 1 : 'Disgust', 2 : 'Fear', 3 : 'Happiness', 4 : 'Sad', 5 : 'Surprise', 6 : 'Neutral'}

i = 1

for i in range (7):

img = np.squeeze(X_train[i])

plt.subplot(1,7,i+1)

plt.imshow(img)

index = np.argmax(y_train[i])

plt.title(label_dict[index])

plt.axis('off')

i += 1

plt.show()

此代碼使用 matplotlib 的plt.subplots()函數(shù)從訓(xùn)練集中創(chuàng)建圖像的 7x1 子圖網(wǎng)格。

numpy數(shù)組的scruze()方法用于從數(shù)組的形狀中刪除任何一維條目，有效地將4D數(shù)組轉(zhuǎn)換為3D數(shù)組。

對于每個(gè)子圖，imshow()函數(shù)用于顯示相應(yīng)的圖像，title()函數(shù)用來顯示相應(yīng)的標(biāo)簽。

axis()函數(shù)用于關(guān)閉每個(gè)子圖的軸。

輸出是訓(xùn)練集中的前 7 個(gè)圖像的可視化，以及它們對應(yīng)的標(biāo)簽。

使用圖像數(shù)據(jù)生成器進(jìn)行數(shù)據(jù)增強(qiáng)

我們可以進(jìn)行數(shù)據(jù)增強(qiáng)，以獲得更多數(shù)據(jù)來訓(xùn)練和驗(yàn)證我們的模型，以防止過度擬合。數(shù)據(jù)增強(qiáng)可以在訓(xùn)練集和驗(yàn)證集上完成，因?yàn)樗兄谀Ｐ妥兊酶油ㄓ煤徒选?/p>

datagen = ImageDataGenerator( width_shift_range = 0.1,

height_shift_range = 0.1,

horizontal_flip = True,

zoom_range = 0.2)

valgen = ImageDataGenerator( width_shift_range = 0.1,

height_shift_range = 0.1,

horizontal_flip = True,

zoom_range = 0.2)

此代碼創(chuàng)建兩個(gè)ImageDataGenerator對象，datagen和valgen，它們將用于訓(xùn)練和驗(yàn)證期間的數(shù)據(jù)擴(kuò)充。

ImageDataGenerator類是一個(gè)Keras預(yù)處理實(shí)用程序，可以實(shí)時(shí)執(zhí)行各種類型的圖像增強(qiáng)，如移位、翻轉(zhuǎn)、旋轉(zhuǎn)和縮放。

datagen對象包括許多增強(qiáng)技術(shù)：

width_shift_range和height_shift_range分別將圖像在水平和垂直方向上隨機(jī)移動圖像寬度和高度的最大10%。horizontal_flip隨機(jī)水平翻轉(zhuǎn)圖像。zoom_range將圖像隨機(jī)縮放高達(dá)20%的倍數(shù)。

valgen對象包含與datagen相同的擴(kuò)充技術(shù)，但僅在訓(xùn)練期間應(yīng)用于驗(yàn)證集。

通過在訓(xùn)練過程中應(yīng)用數(shù)據(jù)擴(kuò)充，模型將暴露于更大、更多樣的訓(xùn)練數(shù)據(jù)集，這有助于防止過度擬合，并提高模型泛化到新數(shù)據(jù)的能力。

datagen.fit(X_train)

valgen.fit(X_val)

這幾行代碼分別將ImageDataGenerator對象datagen和valgen與訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)相匹配。

ImageDataGenerator對象的fit()方法計(jì)算執(zhí)行數(shù)據(jù)擴(kuò)充所需的任何內(nèi)部統(tǒng)計(jì)信息，例如像素值的平均值和方差。在這種情況下，在datagen和valgen上調(diào)用fit()方法，并將訓(xùn)練集和驗(yàn)證集作為輸入來計(jì)算這些統(tǒng)計(jì)數(shù)據(jù)。

將ImageDataGenerator對象擬合到數(shù)據(jù)后，可以使用它們在訓(xùn)練和驗(yàn)證期間實(shí)時(shí)應(yīng)用數(shù)據(jù)增強(qiáng)。

train_generator = datagen.flow(X_train, y_train, batch_size=64)

val_generator = datagen.flow(X_val, y_val, batch_size=64)

這些代碼行創(chuàng)建了兩個(gè)ImageDataGenerator迭代器，train_generator和val_generator，可用于在訓(xùn)練和驗(yàn)證期間生成一批增強(qiáng)數(shù)據(jù)。

ImageDataGenerator對象的flow()方法接收輸入數(shù)據(jù)和標(biāo)簽的numpy數(shù)組，并動態(tài)生成一批增強(qiáng)數(shù)據(jù)。

在這種情況下，使用datagen上的flow()方法創(chuàng)建train_generator，輸入訓(xùn)練數(shù)據(jù)X_train和y_train，批量大小為64。val_generator在valgen上使用相同的方法創(chuàng)建，輸入驗(yàn)證數(shù)據(jù)X_val和y_val，批量大小為64。

在訓(xùn)練期間，train_generator（迭代器）將用于為每個(gè)訓(xùn)練時(shí)期動態(tài)生成一批增強(qiáng)數(shù)據(jù)。類似地，val_generator迭代器將用于為每個(gè)驗(yàn)證epoch生成一批增強(qiáng)數(shù)據(jù)。

代碼下載

http://onepagecode.s3-website-us-east-1.amazonaws.com/

設(shè)計(jì)模型卷積神經(jīng)網(wǎng)絡(luò)（CNN）模型

CNN模型有許多層，具有不同的單元，例如卷積層，最大池化層，批量歸一化和退出層，以規(guī)范模型。

def cnn_model():

model= tf.keras.models.Sequential()

model.add(Conv2D(32, kernel_size=(3, 3), padding='same', activation='relu', input_shape=(48, 48,1)))

model.add(Conv2D(64,(3,3), padding='same', activation='relu' ))