Face_Detect.py

# -*- coding: utf-8 -*-
"""
Created on Wed Feb 23 10:56:23 2022

@author: USER
"""

from facenet_pytorch import MTCNN, InceptionResnetV1
import torch
from torchvision import datasets
from torch.utils.data import DataLoader
from PIL import Image
import cv2
import time
import os
from torchvision import datasets, transforms, models
import numpy as np

data_dir = 'C:/Windows/System32/kwontest2/data'

# TODO : Resize the datasets
data_transform = transforms.Compose([transforms.Resize((160, 160))])

# TODO: Load the datasets with ImageFolder
dataset = datasets.ImageFolder(data_dir, transform = data_transform)

# TODO: Get names of peoples from folder names
idx_to_class = {i:c for c,i in dataset.class_to_idx.items()}

# initializing MTCNN and InceptionResnetV1 
pic1 = MTCNN(image_size=160, margin=0, keep_all=False, min_face_size=40)
pic2 = MTCNN(image_size=160, margin=0, keep_all=True, min_face_size=40)
model = InceptionResnetV1(pretrained='vggface2').eval()

def collate_fn(x):
    return x[0]

loader = DataLoader(dataset, collate_fn=collate_fn)

face_list = [] # list of cropped faces from photos folder
name_list = [] # list of names corrospoing to cropped photos
embedding_list = [] # list of embeding matrix after conversion from cropped faces to embedding matrix using resnet

for img, idx in loader:
    face, prob = pic2(img, return_prob=True) 
    if face is not None and prob>0.90: # if face detected and porbability > 90%
        emb = model(face) # passing cropped face into resnet model to get embedding matrix
        embedding_list.append(emb.detach()) # resulten embedding matrix is stored in a list
        name_list.append(idx_to_class[idx]) # names are stored in a list
        
# save data
data = [face_list, embedding_list, name_list] 
torch.save(data, 'C:/Windows/System32/kwontest2/data.pt') # saving data.pt file

# Using webcam recognize face

# loading data.pt file
load_data = torch.load('data.pt') 
embedding_list = load_data[0] 
name_list = load_data[1] 

cam = cv2.VideoCapture(0) 

while True:
    ret, frame = cam.read()
    if not ret:
        print("fail to grab frame, try again")
        break
        
    img = Image.fromarray(frame)
    img_cropped_list, prob_list = pic2(img, return_prob=True) 
    
    if img_cropped_list is not None:
        boxes, _ = pic2.detect(img)
                
        for i, prob in enumerate(prob_list):
            if prob>0.90:
                emb = model(img_cropped_list[i].unsqueeze(0)).detach() 
                
                dist_list = [] # list of matched distances, minimum distance is used to identify the person
                
                for idx, emb_db in enumerate(embedding_list):
                    dist = torch.dist(emb, emb_db).item()
                    dist_list.append(dist)

                min_dist = min(dist_list) # get minumum dist value
                min_dist_idx = dist_list.index(min_dist) # get minumum dist index
                name = name_list[min_dist_idx] # get name corrosponding to minimum dist
                
                box = boxes[i] 
                
                original_frame = frame.copy() # storing copy of frame before drawing on it
                
                if min_dist<0.90:
                    frame = cv2.putText(frame, name+' '+str(min_dist), (box[0],box[1]), cv2.FONT_HERSHEY_SIMPLEX, 1, (0,255,0),1, cv2.LINE_AA)
                
                frame = cv2.rectangle(frame, (box[0],box[1]) , (box[2],box[3]), (255,0,0), 2)

    cv2.imshow("IMG", frame)
        
    
    k = cv2.waitKey(1)
    if k%256==27: # ESC
        print('Esc pressed, closing...')
        break
        
    elif k%256==32: # space to save image
        print('Enter your name :')
        name = input()
        
        # create directory if not exists
        if not os.path.exists('photos/'+name):
            os.mkdir('photos/'+name)
            
        img_name = "photos/{}/{}.jpg".format(name, int(time.time()))
        cv2.imwrite(img_name, original_frame)
        print(" saved: {}".format(img_name))
        
        
cam.release()
cv2.destroyAllWindows()