SimilarPictures

Inception Resnet V2를 사용하여 이미지 유사도 측정하여 군집화 하기

Requirements

Python 3.5

tf-slim

trained ckpt link: inception_resnet_v2.ckpt based on naver_dataset

GOAL

STEP 0: Data Augmentation

naver에서 받은 data로 train을 하기에는 데이터 양이 부족하다고 생각되었습니다. 따라서 Augmentation을 활용하여 데이터셋을 늘리고 다양한 환경에서도 분류가 될수 있도록 하였습니다.

Augmentation:

1. Affine            :SimilarPictures/uitls/Affine.py
2. Blur              :SimilarPictures/uitls/Blur.py
3. Flip              :SimilarPictures/uitls/Flip.py
4. Translate left    :SimilarPictures/uitls/Translation.py
5. Translate right   :SimilarPictures/uitls/Translation.py

STEP 1: Convert data (tfrecord)

이미지 데이터 tfrecord 포맷으로 바꾸기 데이터셋 구성은 data_foler_view.txt 에서 볼 수 있습니다. 기존에 받은 네이버 데이터셋을 utils안에 subdir_label.py를 실행하여 label로 서브 폴더를 만들어 나누어 줍니다. 다음 slim에 본래 있던 download_and_convert_data.py와, datasets디렉토리 안에 naver.py, download_and_convert_naver.py를 추가해주고 dataset_factory.py 를 수정하였습니다. 다음 코드를 실행

python download_and_convert_data.py --dataset_name=[데이터셋이름] --dataset_dir=[데이터셋경로]

자동으로 validation 과 train을 나누어서 tfrecord로 변환하였습니다. 저희는 Data Augmentation을 하여서 'train': 50844, 'validation': 12711으로 나누었습니다

STEP 2: Train

https://github.com/tensorflow/models 을 clone 합니다. 해당 명령어는 저희의 directory path에 맞춰넣은 것이므로 path는 사용자의 path에 맞게 수정가능 합니다. 다른 옵션의 의문점은 https://github.com/tensorflow/models/tree/master/research/slim 에서 확인 가능합니다.

python train_image_classifier.py 
    --train_dir=/tfpath/naver/log_inception_resnet_v2_naver 
    --dataset_dir=/tfpath/naver/naver/ 
    --dataset_name=naver 
    --dataset_split_name=train 
    --max_number_of_steps=20000  
    --batch_size=35 
    --model_name=inception_resnet_v2 
    --checkpoint_path=/tfpath/naver/inception_resnet_pretrained/inception_resnet_v2_2016_08_30.ckpt 
    --checkpoint_exclude_scopes=InceptionResnetV2/Logits,InceptionResnetV2/AuxLogits 
    --trainable_scopes=InceptionResnetV2/Logits,InceptionResnetV2/AuxLogits

STEP 3: Evaluate

train이 완료되었다면 평가할 필요가 있습니다 아래의 실행 명령어로 얼마나 훈련이 잘되었는지 봅시다.

python eval_image_classifier.py alsologtostderr 
    --checkpoint_path=/tfpath/naver/log_inception_resnet_v2_naver/ 
    --dataset_dir=/tfpath/naver/naver/ 
    --dataset_name=naver 
    --dataset_split_name=validation 
    --model_name=inception_resnet_v2

STEP 4: Test

make_labels_pred.py에 path를 적절하게 바꾸어서 *.ckpt를 적용하고 test를 진행할 데이터 경로를 설정합니다.

python make_labels_pred.py

실행을 하면 original 데이터에서 사용자가 원하는 갯수만큼 랜덤으로 뽑아서 test 데이터를 설정한 경로에 구성합니다. 다음 test data들을 차례대로 Top-5 출력하고 label_true.txt, label_pred.txt, img_paths.txt를 만듭니다.

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
__pycache__		__pycache__
datasets		datasets
deployment		deployment
nets		nets
preprocessing		preprocessing
utils		utils
README.md		README.md
__init__.py		__init__.py
config.py		config.py
data_folder_view.txt		data_folder_view.txt
download_and_convert_data.py		download_and_convert_data.py
eval_image_classifier.py		eval_image_classifier.py
evaluation.py		evaluation.py
img_paths.txt		img_paths.txt
labels_pred1.txt		labels_pred1.txt
labels_pred2.txt		labels_pred2.txt
labels_true.txt		labels_true.txt
make_labels_pred.py		make_labels_pred.py
make_labels_true.py		make_labels_true.py
train_image_classifier.py		train_image_classifier.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SimilarPictures

Requirements

GOAL

STEP 0: Data Augmentation

STEP 1: Convert data (tfrecord)

STEP 2: Train

STEP 3: Evaluate

STEP 4: Test

About

Releases

Packages

Languages

haezu/SimilarPictures

Folders and files

Latest commit

History

Repository files navigation

SimilarPictures

Requirements

GOAL

STEP 0: Data Augmentation

STEP 1: Convert data (tfrecord)

STEP 2: Train

STEP 3: Evaluate

STEP 4: Test

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages