ABCDEFGHIJKLMNOPQRS
1
IndexCppNameNameWiki
AntiSeoUpperBound
TagsDescriptionAuthorsResponsiblesGroupTicket
ImplementationTime
UseArtifactMinValueMaxValueDependsOnCountriesCanonicalValueComment
2
0FI_PAGE_RANKPRhttps://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/PageRank1TG_DOC, TG_LINK_GRAPH, TG_STATIC, TG_L2, TG_UNUSEDPage rank. Фактор ремапится.aavdonkinaavdonkin
3
1FI_TEXT_RELEVTR0,95TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USEТекстовая релевантность (maxfreq – частота самого частого слова, которая имеет смысл длины документа).gulin, iseg, leo, maslovgulin, leo, maslovLegacyTR
4
2FI_LINK_RELEVLR1TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATEDЛинковая релевантность. Фактор ремапится.aavdonkin, gulin, leshch, melkovaavdonkin, gulin, melkovDynamic
5
3FI_PAGE_RANK_BONUSPrBonushttps://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/PageRankBonusTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USEPriority bonus, приоритет 7 - текстовый приоритет. Фактор бинарный, имеет значение 0 для всех однословных запросов, и значение 1 практически для всех двух и более словных, кроме очень маленького количества ответов, для которых нет ни одной ссылки, прошедшей кворум, и текст тоже не прошел кворум.gulin, leopavelgurDynamic
6
4FI_TEXT_RELEV_ALL_WORDSTRp1TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USEПриоритет strict для TR - текстовый приоритет - есть все слова запроса где-то в документе (при этом они проходят контекстные ограничения запроса, например, оба слова д.б. в одном предложении).denplusplus, gulin, leoalsafr, gulin, leoLegacyTR
7
5FI_TEXT_RELEV_PHRASETRp2TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_REARR_USE, TG_NN_OVER_FEATURES_USEПриоритет phrase для TR - текстовый приоритет - есть все слова запроса подряд в документе.denplusplus, gulin, leoalsafr, gulin, leoLegacyTR
8
6FI_LINK_RELEV_ALL_WORDSLRp1TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED(strict) есть все слова запроса в одном линке.gulin, leogulin, leoDynamic
9
7FI_LINK_RELEV_PHRASELRp2TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED(phrase) есть все слова запроса подряд в одном линке.gulin, leogulin, leoDynamic
10
8FI_TEXT_RELEV_TITLETRtitleTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USEНаличие точной фразы (текста запроса) в заголовке (если точнее, в первом предложении документа). Контекстные ограничения и стоп слова учитываются в точности как в TRp2, т.е. factor[8] minors factor[5]denplusplus, gulin, leoalsafr, gulin, leoLegacyTR
11
9FI_TEXT_RELEV_WHOLE_HR_MATCHEDTRhrTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USEВстретился участок, прошедший кворум, в котором все словопозиции обозначены как имеющие релевантность BEST_RELEV (заголовок или meta keywords).gulin, leogulin, leoLegacyTR
12
10FI_REMOVED_10Removed_10TG_UNUSED
13
11FI_NEWSNewshttp://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-3TG_HOST, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USEЭто новости (определяется по характерным ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-3 паттернам в url`е)) ).gulingulin
14
12FI_SHOPShophttp://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-41TG_HOST, TG_STATIC, TG_BINARY, TG_DEPRECATED, TG_OFTEN_ZEROЭто магазин предложение (определяется по характерным ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-4 паттернам в url`е)) ). Не используется (deprecated)gulingulin
15
13FI_CATALOGCathttp://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-21TG_HOST, TG_STATIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USEЭто каталог (определяется по характерным ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-2 паттернам в url`е)) или по яндекс-каталогу).gulingulin
16
14FI_YA_BARYaBarhttp://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/YaBar1TG_BROWSER, TG_HOST, TG_STATIC, TG_USER, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_VISITS_ACTIVITY_DOWNLOADS, TG_USERFEATПосещаемость из Бара - ((http://wiki.yandex-team.ru/AndrejjKostjagin/YaBarLog/HostStat Описание данных)). Фактор ремапится.kostyagin, somovtarum, niknik
17
15FI_LONGLongTG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USEДлинный документ (чем длиннее документ, тем больше значение фактора).gulingulin
18
16FI_HIT_WEIGHTTRhitwTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_REARR_USE, TG_NN_OVER_FEATURES_USEHitweigt - вариант текстовой релевантности, в которой веса всех хитов считаются равными (т.е. не учитывают надбавки за title и за близость слов). При этом соответствующие хиты должны пройти ограничения синтаксического колдунщика, т.е. можно считать, что фактор TRhitw равен 0 тогда и только тогда, когда SoftAndOk равен 0gulin, leogulin, leoLegacyTR
19
17FI_LONG_QUERYLongQueryTG_QUERY_ONLY, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_L3_OVERWRITE, TG_NN_OVER_FEATURES_USEСумма idf слов запроса. Название не отражает суть: например, для запроса 'Гадяч' этот фактор будет больше, чем для запроса 'Москва Питер Екатеринбург Самара'.gulingulinQuery
20
18FI_PURE_TEXTPureTexthttp://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/LongTextTG_BINARY, TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USEДлинный текст без ссылок.leotsimkha, leo
21
19FI_ROOTRoothttp://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/Root1TG_BINARY, TG_DOC, TG_STATIC, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USEЭто морда.gulingulin, tsimkha
22
20FI_REMOVED_20Removed20TG_UNUSED
23
21FI_REMOVED_21Removed21TG_UNUSED
24
22FI_GEOGeoTG_DYNAMIC, TG_LOCALIZED_COUNTRY, TG_HOST, TG_BINARY, TG_DEPRECATED, TG_UNDOCUMENTED, TG_OFTEN_ZEROОзначает совпадение региона пользователя и сайта на уровне стран. Фактор бинарный: 1-совпадает, 0-нет. Основан на ((http://wiki.yandex-team.ru/ЯндексПоиск/КлассификацияСайтовИСтраниц/Географическая/ИспользованиеВПоиске геоклассификации сайтов))ark-kum, gulin, maslovark-kum, gulin, maslov
25
23FI_SUBQUERY_THEME_MATCHSubqueryThMatchTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_THEME_CLASSIF, TG_UNDOCUMENTED, TG_L2, TG_DEPRECATEDСовпадение тематических спектров запроса и документа. Тематика запроса - результат работы ((http://wiki.yandex-team.ru/EvgenijjKroxalev/subquery правила колдунщика SubquerySearch )) Тематика документа берется из яндекс-каталогаabokov, ekrokhalev, gulingulin, lamo
26
24FI_SRSRTG_DOC, TG_STATIC, TG_TRANS, TG_UNDOCUMENTED, TG_UNUSEDСложносоставной static rank, собирается из статических компонентов по отдельной формуле((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/#oftnd1 *)).gulin, somovgulin, somov
27
25FI_REFINESTRrefTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE
Фактор про число refines. В языке запросов есть фича user refines ('слово, перед которым стоит знак процентика'). По задумке это означает что-то вроде 'хорошо бы, чтобы слово в документе было'. Единственное известное ((http://staff.yandex-team.ru/gulin Андрей Гулин)) ценное использование данной фичи - это запрос [%официальный %сайт НазваниеФирмы]. Пользователям данная фича неизвестна, т.к. не описана ни в какой документации. Планируется, что она исчезнет из языка запросов, но в колдунщике слова с приоритетом USER_REFINE останутся. Фактор говорит о том, сколько максимум USER_REFINE-слов одновременно встречалось в рамках единого попадания в кворум. Считается, что их от 0 до 3 (если >3, то считается, что 3). Это число мапится в полуинтервал [0,1)
gulin, leogulin, leoLegacyTR
28
26FI_TR_BOOSTTRboostTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USEЧисло, на которое умножаются некоторые линковые факторы (именно, факторы номер 6, 7, 47, 66), если текстовая релевантность 0, и ссылок малоgulingulinDynamic
29
27FI_TRLR_LEMMATRLRlemmaTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_SAMOHOD_UNIMPLEMENTED, TG_CALLISTO_UNIMPLEMENTED, TG_NN_OVER_FEATURES_USEВ текстовой релевантности произошло совпадение леммы.gulin, leogulin, leoDynamic
30
28FI_TRAFGRAPH_OUT_ALL_SHARE_DTrafgraphOutAll_share_dTG_OWNER, TG_STATIC, TG_OFTEN_ZERO, TG_COMMERCIAL, TG_NN_OVER_FEATURES_USERemapped mascot feature TrafgraphOutAll_share_dbikulovbikulov, sdormidontovSEARCHSPAM-1553130.09.2020
31
29FI_RELEV_SENTS_DSSMRelevSentsDssmTG_DYNAMIC, TG_DOC, TG_DOC_TEXT, TG_NEURAL, TG_NN_OVER_FEATURES_USEDssm модель, обучена на переформулировки, в документной части использует релевантные запросу предложенияpadesepadeseFACTOR-225903.03.2020{Name: "DssmRelevSents"}
32
30FI_FRESH_NEWS_DETECTOR_PREDICTFreshNewsDetectorPredictTG_DYNAMIC, TG_QUERY_ONLY, TG_USER, TG_FRESHNESS_USE, TG_L2, TG_QUERY_DETECTOR_PREDICT, TG_UNUSED, TG_NOT_01Значение детектора новостей, рассчитываемого в бегемоте. Всегда 0 при значении детектора меньше порога.alejes, hyggealejes, hyggeWEBFRESH-47827.09.2020-3,00E+383,00E+38
33
31FI_HIT_NUM_100LRHitNum100TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATEDПреобразованное количество слов запроса во всех линках url`а.leshchalsafrLegacyLR
34
32FI_HIT_NUM_GT_16LRHitNumGt16TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_DEPRECATEDУ документа LR>20 количество вхождение слов запроса в линках > 16, фактор про LR.leshchalsafrLegacyLR
35
33FI_PCT_LINKSPctLinksTG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATEDДля документов с высокой LR - нормированная линковая релевантность без учета близости, для документов с низкой LR 0leshchalsafrLegacyLR
36
34FI_HAS_LRHasLRTG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATEDUrl высокую LR.denplusplusalsafrLegacyLR
37
35FI_LINK_QUALITYLinkQualityTG_DOC, TG_LINK_TEXT, TG_STATIC, TG_DEPRECATED, TG_L2Качество входящих ссылок (классификатор Лещинера) - сломан, см [405]leshchalsafr
38
36FI_ALICE_MUSIC_TRACK_TITLE_COSINE_MATCH_MAX_PREDICTIONAliceMusicTrackTitleCosineMatchMaxPredictionhttps://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/lingboostTG_UNUSED, TG_DYNAMIC, TG_DOC, TG_ALICE_MUSIC, TG_ANNOTATION_NOFILTER, TG_TEXT_MACHINE, TG_ALLOW_USE_FOR_ALICEЗначение фактора CosineMatchMaxPrediction для стрима AliceMusicanrodiginaanrodigina, gotmanov, hommforeverBUKI-293211.03.2020
39
37FI_NUM_LINKSNumLinkshttp://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/NumLinksTG_DOC, TG_LINK_GRAPH, TG_STATIC, TG_L2, TG_UNUSEDЧисло входящих ссылок. Ремапится.tsimkha, alsafr
40
38FI_POPULAR_QPopularQhttp://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/PopularQTG_DYNAMIC, TG_QUERY_ONLY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_REARR_USE, TG_L2, TG_DEPRECATEDПопулярность запросаdenplusplusdiver, akhropovQuery[{Feature: ["PopularQ"], Slice: "begemot_query_factors"}]
41
39FI_TR_UNMAPPEDTRUnmappedTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USETR деленный на куб количества слов в запросе и преобразованный стандартным remapTR.denplusplus, gulinalsafr, gulinLegacyTR
42
40FI_RUS_LANGRusLangTG_DOC, TG_DOC_TEXT, TG_STATIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USEЯзык документа - русский.aalekseev, denplusplusalsafr
43
41FI_ADD_TIMEAddTimeTG_DATE, TG_DOC, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEВремя добавления страницы, больше - более старый документ; кладется корень из времени, отображенный на интервал [0,1] так, чтобы 3+ года давало 1.aalekseev, denplusplusalsafr
44
42FI_IS_MAIN_PAGEIsMainPageTG_DOC, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USEЕсли главная страница владельца (чаще всего домен второго уровня, например xxxx.ru), то фактор равен 1. Для бомжатников, хостингов, личных блогов и т.д. (например, лайфджорнал, народ.ру и пр.) - домены третьего уровня (типа xxxxx.narod.ru) так же будут иметь фактор равный 1.aalekseev, denplusplusalsafr
45
43FI_ADD_TIME_MPAddTimeMP1TG_DATE, TG_HOST, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEВремя добавления главной страницы владельца (хоста?), ремапится так же, как AddTime.aalekseev, denplusplusalsafr
46
44FI_ALICE_MUSIC_TRACK_TITLE_ANNOTATION_MAX_VALUE_WEIGHTEDAliceMusicTrackTitleAnnotationMaxValueWeightedhttps://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/lingboostTG_UNUSED, TG_DYNAMIC, TG_DOC, TG_ALICE_MUSIC, TG_ANNOTATION_NOFILTER, TG_TEXT_MACHINE, TG_ALLOW_USE_FOR_ALICEЗначение фактора AnnotationMaxValueWeighted для стрима AliceMusicanrodiginaanrodigina, gotmanov, hommforeverBUKI-293211.03.2020
47
45FI_URL_CLICKS_PCTRQueryURLClicksPCTRhttp://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#queryurldownerclickspctrfrccomboreg0,6TG_DYNAMIC, TG_DOC, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATEDНасколько часто кликают в данный URL по данному запросу - CTR домноженный на поправочный коэффициентakhropov, solartarum, niknikCNT_RELEV
48
46FI_TEXT_BM25TextBM25TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEПростой BM25 по тексту.gulingulinTextBM25
49
47FI_LINK_BM25LinkBM25TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_DEPRECATEDПростой BM25 по линкам, веса линков не учитываются.gulingulinLinkBM25, Dynamic
50
48FI_TLBM25TLBM25TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_L2, TG_DEPRECATEDПростой BM25 по тексту и линкам одновременно.gulingulinTextAndLinkBM25
51
49FI_TLP1TLp1TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_L2, TG_DEPRECATEDВсе слова запроса есть в тексте + линках.gulingulinTextAndLinkBM25
52
50FI_ADVAdvTG_OWNER, TG_STATIC, TG_BINARY, TG_DEPRECATED, TG_OFTEN_ZEROНа сайте есть реклама.aalekseev, denplusplussisoid, alsafr
53
51FI_YANDEX_ADVYandexAdv1TG_OWNER, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_DEPRECATED, TG_OFTEN_ZEROНа сайте есть реклама Яндекса.aalekseev, denplusplussisoid, alsafr
54
52FI_NO_SPAMNoSpam1TG_OWNER, TG_STATIC, TG_THEME_CLASSIF, TG_REARR_USE, TG_DEPRECATEDКлассификатор спама по фичам из антиспама признал сайт НЕ(!) спамом. Т.е. 0=спам, 1=хороший.aalekseev, denplusplusalsafr
55
53FI_TEXT_PAIRTxtPairTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEПростой BM25 по парам слов - берем все пары слов запроса и считаем число их вхождений в текст документа. В качества веса пары используем сумму весов слов. Комм Не работает, если в запросе есть стоп-словоgulingulinTextBM25
56
54FI_LINK_PAIRLnkPairTG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_L2, TG_DEPRECATEDТо же, что TxtPair, но для линков; веса линков не учитываются.gulingulinLinkBM25
57
55FI_TEXT_BREAKTxtBreakTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEBM25 от количества предложений в документе, в которых встречается.gulingulinTextBM25
58
56FI_TEXT_HEADTxtHeadTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEBM25 по словам только в заголовке.gulingulinTextBM25
59
57FI_TEXT_HI_RELEVTxtHiRelTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEBM25 по словам только с high rel-битиками ('значимым', с выделением (<b> итп)).gulingulinTextBM25
60
58FI_REMOVED_58Removed_58TG_UNUSED
61
59FI_WORD_COUNTWordCountTG_QUERY_ONLY, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEMin(число слов запроса/10, 1.f)denplusplus, gulinalsafr, gulinQuery
62
60FI_INV_WORD_COUNTInvWordCountTG_DYNAMIC, TG_QUERY_ONLY, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE1 / количество_слов_в_запросе.denplusplus, gulinalsafr, gulinQuery
63
61FI_HAS_NO_TRHasNoTRTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USEУ документа нет TR.denplusplus, gulinalsafr, gulinLegacyTR1
64
62FI_HAS_NO_LRHasNoLRTG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATEDУ документа нет LR.denplusplus, gulingulin, alsafrLegacyLR1
65
63FI_HAS_NO_QUERY_URL_SHOWSHasNoQueryURLShowshttp://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#hasnoqueryurldownershows1TG_DYNAMIC, TG_DOC, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_BINARY, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATEDДля данного урла для данного запроса нет информации о кликабельности 1 - запроса или запроса-urla нет в базе кликов, 0 - запрос-url есть в базе кликовdenplusplus, kostyagintarum, niknikCNT_RELEV1
66
64FI_HAS_NO_QUERY_SHOWSHasNoQueryShowshttp://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#hasnoqueryshows
TG_DYNAMIC, TG_QUERY_ONLY, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_USER_SEARCH_EXTERNAL, TG_BINARY, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATED
Для данного запроса нет информации о кликабельности 1 - запроса нет в базе кликов, 0 - запрос есть в базе кликов.denplusplus, kostyagin, akhropovtarum, niknikCNT_RELEV1
67
65FI_HOPSHopsTG_DOC, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEКоличество хопов урла в обходе (типа меньше - ближе к морде, тем меньше значение (0 - морда, 1 - с морды добраться нельзя, 0 < можно добраться с морды < 1). Нормальное значение для корня носта 0.0039).denplusplusalsafr
68
66FI_LOG_LRLogLR0,85TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATEDЛогарифм от LR, линейно отображенный в [0,1].denplusplus, karpikalsafrDynamic
69
67FI_TEXT_PAIR_EXTxtPairExTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEналичие пар слов по точной формеalsafrTextBM25
70
68FI_TEXT_BREAK_EXTxtBreakExTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEколичество предложений, в которых встречается много слов по точной формеalsafrTextBM25
71
69FI_TEXT_HEAD_EXTxtHeadExTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEналичие слов в заголовке по точной формеalsafrTextBM25
72
70FI_TEXT_HI_RELEV_EXTxtHiRelExTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEBM25 по точной формеalsafrTextBM25
73
71FI_TEXT_BM25_EXTxtBm25ExTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEПростой BM25 по точной форме.alsafrTextBM25
74
72FI_TEXT_PAIR_SYNTxtPairSyTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEналичие пар слов c учетом синонимов (>=TxtPair)alsafrTextBM25
75
73FI_TEXT_BRAEK_SYNTxtBreakSyTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEколичество предложений, в которых встречается много слов c учетом синонимовalsafrTextBM25
76
74FI_TEXT_HEAD_SYNTxtHeadSyTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_REARR_USE, TG_NN_OVER_FEATURES_USEналичие слов в заголовке c учетом синонимовalsafrTextBM25
77
75FI_TEXT_HI_RELEV_SYNTxtHiRelSyTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEBM25 c учетом синонимовalsafrTextBM25
78
76FI_TEXT_BM25_SYNTxtBm25SyTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USEПростой BM25 c учетом синонимов.alsafrTextBM25
79
77FI_QUERY_DOWNER_CLICKS_PCTRQueryDOwnerClicksPCTRhttp://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#queryurldownerclickspctrfrccomboregTG_DYNAMIC, TG_DOWNER, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_USER_SEARCH_EXTERNAL, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATEDНасколько часто кликают в URLы данного domainId по данному запросу - CTR domainId домноженный на поправочный коэффициентakhropov, solar, denplusplustarum, niknikCNT_RELEV
80
78FI_HAS_NO_QUERY_DOWNER_SHOWSHasNoQueryDOwnerShowshttp://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#hasnoqueryurldownershowsTG_DYNAMIC, TG_DOWNER, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_USER_SEARCH_EXTERNAL, TG_BINARY, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATEDДля данного domainId для данного запроса нет информации о кликабельности 1 - запроса или запроса-владельца нет в базе кликов, 0 - запрос-владелец есть в базе кликовdenplusplus, kostyagintarum, niknikCNT_RELEV1
81
79FI_OWNER_CLICKS_PCTROwnerClicksPCTRhttp://wiki.yandex-team.ru/ЯндексПоиск/КачествоПоиска/Клики#ownerclickspctrregTG_STATIC, TG_OWNER, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_OFTEN_ZERO, TG_L2, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATEDКликабельность владельца независимо от запросаakhropov, maslovtarum, niknik
82
80FI_MEGAFONMegafonTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_UNUSEDОтносительная частота слов запроса в ссылках (1 - слова запроса часто встречаются в ссылках, 0.3 - редко); если точнее, значение этого фактора пессимизируется при условии: TR=0 && LR=0 && (нет ни одной ссылки со всеми словами запроса) && (не прошёл кворум) && (в тексте встречается хотя бы одна пара слов запроса)alsafr
83
81FI_HAS_ALL_WORDS_MERGEDXLRp0TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATEDВ ссылках есть все слова запросаalsafrXref
84
82FI_HAS_ALL_WORDS_IN_LINKXLRp1TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATEDВ одной ссылке есть все слова запросаalsafrXref
85
83FI_PHRASEXLRp2TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATEDЕсть ссылка, прошедшая кворумalsafrXref
86
84FI_GOOD_RATIOXLRgoodTG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_REARR_USE, TG_UNDOCUMENTED, TG_DEPRECATEDКакая доля ссылок “хорошая”alsafrXref
87
85FI_MANY_BADXLRmanyBad1TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATEDНасколько много “плохих” ссылок (плохой = dpr = 0)alsafrXref
88
86FI_LR_MAX_DPRXLRmaxDprTG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATEDМаксимальный dpr ссылкиalsafrXref
89
87FI_LR_TF_IDFXLRtfidfTG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATEDTfIdf обычный TF*IDF по ссылкам. Частота слова в ссылках умножается на обратную документную частоту и суммируется по всем словам, потом нормируется на длину документа.alsafrXref
90
88FI_LR_RELEVXLRrelevhttp://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/OpisanijaFaktorov#h20931-2TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATEDЛинковая релевантность от ГулинаgulingulinXref
91
89FI_LR_RELEV_200XLRrelev200TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATEDЛинковая релевантность от ГулинаgulingulinXref
92
90FI_LR_LOG_RELEVXLRlogRelevTG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATEDЛинковая релевантность от ГулинаgulingulinXref
93
91FI_BF_EXACTBFexactTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_DEPRECATEDЕсть точная форма всех слов запроса в тексте/линкахalsafrBestForm
94
92FI_BF_LEMMABFlemmaTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_DEPRECATEDЕсть лемма всех слов запроса в тексте/линкахalsafrBestForm
95
93FI_SOFT_AND_OKSoftAndOkTG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USEДокумент прошел softand по ограничениям синтаксического колдунщика. Только для документов, имеющих текстовую релевантность. Для однословных запросов всегда 1.alsafrDynamic
96
94FI_NEW_LINK_QUALITYNewLinkQualityTG_DOC, TG_LINK_GRAPH, TG_STATIC, TG_DEPRECATEDКлассификатор качества входящих ссылок 2 - сломан, см [407]alsafr
97
95FI_UKRUkrainianTG_STATIC_REGINFO, TG_HOST, TG_STATIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USEравен единице, если у сайта стоит украинский гео-атрибут(т.е 1 - украинский сайт)alsafr
98
96FI_IS_BLOGIsBloghttp://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-5TG_HOST, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USEСтраница с блогохостингаburmisha, zudinaburmisha, zudina
99
97FI_IS_LJIsLivejournalTG_HOST, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USEСтраница с livejournal.comalsafr
100
98FI_REMOVED_98Removed_98TG_UNUSED