Pull to refresh
27
0

User

Send message
Ребята вроде как после последнего скандала договорились. Договорились, что после определенного срока каналы отключат. Все согласились, все хорошо. Оверсан в очередной раз напоминают когда это случится. Мне кажется, это хорошо, а Вам?
Как я понимаю, завтра сами товарищи из Макхоста с 9-ти часов начнут лить данные, а потом благополучно скажут, как они их сохранили для вас. Поэтому и срок до 9-ти, а не до 12. И поэтому доступ дали ночью, а не в течение рабочего дня.
Ну здесь несколько моментов:
1. Комбинаций по 2 буквы вообще не много, собственно примерно 33^2, можно и сразу заполнить.
2. Все-таки искать сразу в тексте ничего не даст. В любом случае надо сначала искать слова/фразы. То есть набор «стереограмм» или «триграмм» надо искать в пределах одного слова/фразы, а потом ссылать на статью. Во-первых, надо же показать правильное слово, а второе — уверен, что любой набор из 2-х букв будет встречаться практически в любом тексте. Если не все стереограммы, то большая часть из набора.
3. 3 буквы, а не 2, используются для того, чтобы была большая определенность, больший процент вероятности совпадения. Мне кажется, лучше пробовать с 3-мя.

Интересно, что получилось в результате? Или это еще пока идея?
Было, и очень красиво. Наблюдали из офиса, м. Дмитровская.
Мы сначала обратили внимание, что все потемнело с оранжево-коричневым оттенком, что-то вроде как сепию наложили. Подумали поначалу, что нам окна затонировали :) Пришлось открывать)

А потом вот и этот «гламурный» сиренево-розовый. Держалось минут 10 в ярком виде.
Ну чисто теоретически наверно можно, но много сложностей. Например, вы же не знаете, какие триграммы будут в поле, какие нет — придется искать по условию «или», а в этом случае будет будет слишком много результатов даже на небольшой фразе.
Следующая проблема — рейтинг, придется писать какую-то функцию в MySql, которая будет считать количество вхождений, чтобы потом сортировать по ее результату.
И самое главное — производительность. Непонятно, насколько быстро это будет работать.

Хотя, если создать отдельное поле, сразу заполнить его триграммами и повесить полнотекстовый индекс, то можно попробовать) Если вдруг решитесь, напишите о результатах, интересно)
Вполне вероятно, что для MySql есть подобные модули, но я не встречал. Поверхностный поиск в сети тоже ничего не дал, хотя может нужно поискать тщательней.
Перевод в другую раскладку используем.
read.ru/search/geirby/

По поводу словарей, тоже так и делали. В посте было — словари, плюс собственная база, разбитая по словам.
read.ru/search/ушкин/

Тут уже нашлась книга, поэтому подсказок не выдаем. Пробовали разные значения, меньше 5-ти, меньше 10-ти найденных. Часто люди ищут по полному названию с автором, подсказки в этом случае бывают лишними.
Это вопрос целесообразности. Никто не спорит о громадном преимуществе текстового поиска гугла, но искать товары в каталоге лучше по определенным параметрам, и те вещи, которые у нас есть в расширенном поиске, например, при всем желании не прикрутить к поиску гугла.

К тому же полнотекстовый поиск в базах данных — абсолютно нормальная вещь и используется повсеместно. Вас же не смущает что в углу страницы хабра есть поле поиска по сайту и реализован он не с помощью стороннего api, а с использованием sphinx))

А уж по поводу «сделанного по-быстрому» вообще нечего сказать. Если статья читается за 5 минут, это не значит, что придумывается и реализовывается все за то же время)
Ну да, такие веселости встречаются.
Поиск основан на статистике, ничего не поделаешь, видимо пользователи не ищут «пушкин путин»)

Вот ближайшие варианты, которые искали:

phrase			similarity
путин			0,6
путилин			0,384615
плакат путин		0,375
владимир путин		0,315789
без путина		0,3125
Да, у нас win.

megadb=# SELECT show_trgm('Пушкин');           
show_trgm              
-------------------------------------
 {"ин ",кин,пуш,ушк,шки," пу","  п"}
(1 row)
Да, все верно. Результаты также бывают не очень, при пропущенной букве в маленьком слове.
Поэтому используем проверку по целым фразам, а не отдельно по словам. Вероятность получить глупую подсказку гораздо меньше.

Плюс значение имеет по какому принципу определяется верное слово. В нашем случае берем 5 самых схожих фраз — по какой из них нашлось больше упоминаний, там в большинстве случаев и оказывается верной.
тех с кем ты не прочь иногда поговорить, каждый день стоят, и ты изо дня в день молчишь и лишь раз в месяц с кем-нибудь перекинешься чем-нибудь из разряда — «как дела?». Человек не создан для таких явлений.

А как вы еще хотите общаться с людьми? Что вам мешает предложить человеку встретиться, погулять, пообщаться, если уж вам не нравится онлайн-общение. Не спрашивайте «как дела», встретьтесь лично. Но для этого нужно иметь возможность связаться, и аська в этом вполне может помочь.
Или вы предпочитаете общаться только с теми, кого видите ежедневно, на работе, учебе?
Мне здесь больше понравилась идея с favicon с сайтов, куда ведут ссылки.
Цветовое решение — как дополнение. От которого, в принципе, можно избавиться.
Да, я подумал об этом. Но прежде чем выводить favicon с другого сервера, надо проверить его наличие. А для серверного скрипта это может быть очень долго. Об этом есть в статье.
Соглашусь, стало неинтересно.
Сейчас лучше уж изменить условия шоу и сделать стартап, например, за 2 недели… но тот самый ваш революционный проект.
А еще лучше уложить его же в неделю. Версия, конечно, будет урезанная и не полная, но хотя бы остается надежда, что за проектом будут следить дальше.
Тогда уж организовать полноценный Punto в телефоне, в том числе и с этой идеей
Понравились эксперименты, запомнил для себя)
И вообще очень положительно написано, добавляет настроения. Спасибо
1

Information

Rating
Does not participate
Location
Россия
Registered
Activity