поиск одинаковых картинок на php!

Статус
В этой теме нельзя размещать новые ответы.
WOW!
спасибо за ответы!
по поводу нагрузки не запариваюсь - машинки весьма шустрые... и в ночное время на 99% свободны

имхо #6 - самый реальный вариант... :ay:

получается что по всем картинкам проходимся один раз - все заносим в базу и постепенно пополняем ее более новыми имагами... можно так же внедрить некий "кэффициент схожести"... если имага "немного недобирает", то отображать ее админу... даже 20... ну или 50 картинок если вдруг будут "схожими" это не 800к - можно отметить "галочками" какие удалять, а какие нет :)

через недельку-другую буду писать - посмотрим что получистя :ay:

PS. "подмонтировать" не получится... разве что юзать "виртуализацию" и поставить на серв помимо дебиана скажем ту же ХРень и из под нее фигачить... была такая мысля... но как-то мы ее пока ее не рассматриваем как приеемлемую... хотя, возможно зря :nezn:
 
А в чём проблема монтирования папки по FTP или SSH?

эээм... это почти 600Гб... если "ЭТО" делать хотябы раз в неделю, то... порядка 1800Гб только на переброску... блин, имхо ну не самое гуманное решение... :D
это получистя что мой траф с этого серва выростет практически в 1,5 раза... не.. .хотелось бы этого избежать :)))
 
Сам делал подобную вещь..по размеру проверка (пикселей) фармату и весу проверка была...возможность переноса в другую папку или сразу удалять...из минусов, нет возможность из базы удять...

Если нужно в ЛС напиши.
 
задача вообще сложноватая будет.
размеры фиксированные? (800x600, 1024x768)
или могут быть какие хочешь?

что значит "картинки одинаковые"? прям до пропорций четко или "почти" одинаковые?
 
как вариант можно использовать одну из простых методик распознавания текста с учителем.

смысл: уменьшаешь картинку например до 16 на 16.делаешь ее черно белой с серыми оттенками. т.е. получится матрица где каждый пиксель представляется числом от 0 до 255

вот в дальнейшем и сравнивай эти матрицы. поле можно завести char на 768 символов, представляя двухмерную матрицу через одномерную.

таким образом ты сможешь 100% удалять одинаковые картинки разных размеров даже.

а работать это будет так быстро, как ты напишешь код.
не забудь поставить break при сравнении матриц как только найдено первое отличие.

запустить надо только единажды такой скрипт. пометить все картинки как проверенные.
а дальнейшем добавлять в базу картинки и помечать их как не проверенные.
и потом можно по крону запускать задачу на проверку лишь новых картинок.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху