Ребята вроде как после последнего скандала договорились. Договорились, что после определенного срока каналы отключат. Все согласились, все хорошо. Оверсан в очередной раз напоминают когда это случится. Мне кажется, это хорошо, а Вам?
Как я понимаю, завтра сами товарищи из Макхоста с 9-ти часов начнут лить данные, а потом благополучно скажут, как они их сохранили для вас. Поэтому и срок до 9-ти, а не до 12. И поэтому доступ дали ночью, а не в течение рабочего дня.
Ну здесь несколько моментов:
1. Комбинаций по 2 буквы вообще не много, собственно примерно 33^2, можно и сразу заполнить.
2. Все-таки искать сразу в тексте ничего не даст. В любом случае надо сначала искать слова/фразы. То есть набор «стереограмм» или «триграмм» надо искать в пределах одного слова/фразы, а потом ссылать на статью. Во-первых, надо же показать правильное слово, а второе — уверен, что любой набор из 2-х букв будет встречаться практически в любом тексте. Если не все стереограммы, то большая часть из набора.
3. 3 буквы, а не 2, используются для того, чтобы была большая определенность, больший процент вероятности совпадения. Мне кажется, лучше пробовать с 3-мя.
Интересно, что получилось в результате? Или это еще пока идея?
Было, и очень красиво. Наблюдали из офиса, м. Дмитровская.
Мы сначала обратили внимание, что все потемнело с оранжево-коричневым оттенком, что-то вроде как сепию наложили. Подумали поначалу, что нам окна затонировали :) Пришлось открывать)
А потом вот и этот «гламурный» сиренево-розовый. Держалось минут 10 в ярком виде.
Ну чисто теоретически наверно можно, но много сложностей. Например, вы же не знаете, какие триграммы будут в поле, какие нет — придется искать по условию «или», а в этом случае будет будет слишком много результатов даже на небольшой фразе.
Следующая проблема — рейтинг, придется писать какую-то функцию в MySql, которая будет считать количество вхождений, чтобы потом сортировать по ее результату.
И самое главное — производительность. Непонятно, насколько быстро это будет работать.
Хотя, если создать отдельное поле, сразу заполнить его триграммами и повесить полнотекстовый индекс, то можно попробовать) Если вдруг решитесь, напишите о результатах, интересно)
Вполне вероятно, что для MySql есть подобные модули, но я не встречал. Поверхностный поиск в сети тоже ничего не дал, хотя может нужно поискать тщательней.
Тут уже нашлась книга, поэтому подсказок не выдаем. Пробовали разные значения, меньше 5-ти, меньше 10-ти найденных. Часто люди ищут по полному названию с автором, подсказки в этом случае бывают лишними.
Это вопрос целесообразности. Никто не спорит о громадном преимуществе текстового поиска гугла, но искать товары в каталоге лучше по определенным параметрам, и те вещи, которые у нас есть в расширенном поиске, например, при всем желании не прикрутить к поиску гугла.
К тому же полнотекстовый поиск в базах данных — абсолютно нормальная вещь и используется повсеместно. Вас же не смущает что в углу страницы хабра есть поле поиска по сайту и реализован он не с помощью стороннего api, а с использованием sphinx))
А уж по поводу «сделанного по-быстрому» вообще нечего сказать. Если статья читается за 5 минут, это не значит, что придумывается и реализовывается все за то же время)
Да, все верно. Результаты также бывают не очень, при пропущенной букве в маленьком слове.
Поэтому используем проверку по целым фразам, а не отдельно по словам. Вероятность получить глупую подсказку гораздо меньше.
Плюс значение имеет по какому принципу определяется верное слово. В нашем случае берем 5 самых схожих фраз — по какой из них нашлось больше упоминаний, там в большинстве случаев и оказывается верной.
тех с кем ты не прочь иногда поговорить, каждый день стоят, и ты изо дня в день молчишь и лишь раз в месяц с кем-нибудь перекинешься чем-нибудь из разряда — «как дела?». Человек не создан для таких явлений.
А как вы еще хотите общаться с людьми? Что вам мешает предложить человеку встретиться, погулять, пообщаться, если уж вам не нравится онлайн-общение. Не спрашивайте «как дела», встретьтесь лично. Но для этого нужно иметь возможность связаться, и аська в этом вполне может помочь.
Или вы предпочитаете общаться только с теми, кого видите ежедневно, на работе, учебе?
Да, я подумал об этом. Но прежде чем выводить favicon с другого сервера, надо проверить его наличие. А для серверного скрипта это может быть очень долго. Об этом есть в статье.
Соглашусь, стало неинтересно.
Сейчас лучше уж изменить условия шоу и сделать стартап, например, за 2 недели… но тот самый ваш революционный проект.
А еще лучше уложить его же в неделю. Версия, конечно, будет урезанная и не полная, но хотя бы остается надежда, что за проектом будут следить дальше.
1. Комбинаций по 2 буквы вообще не много, собственно примерно 33^2, можно и сразу заполнить.
2. Все-таки искать сразу в тексте ничего не даст. В любом случае надо сначала искать слова/фразы. То есть набор «стереограмм» или «триграмм» надо искать в пределах одного слова/фразы, а потом ссылать на статью. Во-первых, надо же показать правильное слово, а второе — уверен, что любой набор из 2-х букв будет встречаться практически в любом тексте. Если не все стереограммы, то большая часть из набора.
3. 3 буквы, а не 2, используются для того, чтобы была большая определенность, больший процент вероятности совпадения. Мне кажется, лучше пробовать с 3-мя.
Интересно, что получилось в результате? Или это еще пока идея?
Мы сначала обратили внимание, что все потемнело с оранжево-коричневым оттенком, что-то вроде как сепию наложили. Подумали поначалу, что нам окна затонировали :) Пришлось открывать)
А потом вот и этот «гламурный» сиренево-розовый. Держалось минут 10 в ярком виде.
Следующая проблема — рейтинг, придется писать какую-то функцию в MySql, которая будет считать количество вхождений, чтобы потом сортировать по ее результату.
И самое главное — производительность. Непонятно, насколько быстро это будет работать.
Хотя, если создать отдельное поле, сразу заполнить его триграммами и повесить полнотекстовый индекс, то можно попробовать) Если вдруг решитесь, напишите о результатах, интересно)
read.ru/search/geirby/
По поводу словарей, тоже так и делали. В посте было — словари, плюс собственная база, разбитая по словам.
Тут уже нашлась книга, поэтому подсказок не выдаем. Пробовали разные значения, меньше 5-ти, меньше 10-ти найденных. Часто люди ищут по полному названию с автором, подсказки в этом случае бывают лишними.
К тому же полнотекстовый поиск в базах данных — абсолютно нормальная вещь и используется повсеместно. Вас же не смущает что в углу страницы хабра есть поле поиска по сайту и реализован он не с помощью стороннего api, а с использованием sphinx))
А уж по поводу «сделанного по-быстрому» вообще нечего сказать. Если статья читается за 5 минут, это не значит, что придумывается и реализовывается все за то же время)
Поиск основан на статистике, ничего не поделаешь, видимо пользователи не ищут «пушкин путин»)
Вот ближайшие варианты, которые искали:
Поэтому используем проверку по целым фразам, а не отдельно по словам. Вероятность получить глупую подсказку гораздо меньше.
Плюс значение имеет по какому принципу определяется верное слово. В нашем случае берем 5 самых схожих фраз — по какой из них нашлось больше упоминаний, там в большинстве случаев и оказывается верной.
есть, но уже за 25к )
А как вы еще хотите общаться с людьми? Что вам мешает предложить человеку встретиться, погулять, пообщаться, если уж вам не нравится онлайн-общение. Не спрашивайте «как дела», встретьтесь лично. Но для этого нужно иметь возможность связаться, и аська в этом вполне может помочь.
Или вы предпочитаете общаться только с теми, кого видите ежедневно, на работе, учебе?
Цветовое решение — как дополнение. От которого, в принципе, можно избавиться.
Сейчас лучше уж изменить условия шоу и сделать стартап, например, за 2 недели… но тот самый ваш революционный проект.
А еще лучше уложить его же в неделю. Версия, конечно, будет урезанная и не полная, но хотя бы остается надежда, что за проектом будут следить дальше.
И вообще очень положительно написано, добавляет настроения. Спасибо