A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 0 | PR | Page rank. The factor is remapped. | TG_DOC, TG_LINK_GRAPH, TG_STATIC, TG_L2, TG_UNUSED | FI_PAGE_RANK | aavdonkin | aavdonkin | https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/PageRank | Page rank. Фактор ремапится. | 1 | 34 | ||||||||||||||
2 | 1 | TR | Textual relevance (maxfreq - the frequency of the most frequent word, which makes sense of the length of the document). | LegacyTR | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE | FI_TEXT_RELEV | gulin,iseg,leo,maslov | gulin,leo,maslov | Текстовая релевантность (maxfreq – частота самого частого слова, которая имеет смысл длины документа). | 0.95 | 119 | ||||||||||||||
3 | 2 | LR | Link Relevance. The factor is remapped. | Dynamic | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED | FI_LINK_RELEV | aavdonkin,gulin,leshch,melkov | aavdonkin,gulin,melkov | Линковая релевантность. Фактор ремапится. | 1 | 39 | ||||||||||||||
4 | 3 | PrBonus | Priority bonus, priority 7 - text priority. Factor is binary, has value 0 for all single word queries, and value 1 for almost all two or more word queries, except for a very small number of responses, for which there are no links that passed the quorum, and the text did not pass the quorum either. | Dynamic | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE | FI_PAGE_RANK_BONUS | gulin,leo | pavelgur | https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/PageRankBonus | Priority bonus, приоритет 7 - текстовый приоритет. Фактор бинарный, имеет значение 0 для всех однословных запросов, и значение 1 практически для всех двух и более словных, кроме очень маленького количества ответов, для которых нет ни одной ссылки, прошедшей кворум, и текст тоже не прошел кворум. | 298 | ||||||||||||||
5 | 4 | TRp1 | Priority strict for TR is text priority - there are all query words somewhere in the document (and they pass contextual restrictions of the query, for example, both words d.b. in the same sentence). | LegacyTR | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE | FI_TEXT_RELEV_ALL_WORDS | denplusplus,gulin,leo | alsafr,gulin,leo | Приоритет strict для TR - текстовый приоритет - есть все слова запроса где-то в документе (при этом они проходят контекстные ограничения запроса, например, оба слова д.б. в одном предложении). | 198 | |||||||||||||||
6 | 5 | TRp2 | The phrase priority for TR is text priority - there are all query words in a row in the document. | LegacyTR | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_REARR_USE, TG_NN_OVER_FEATURES_USE | FI_TEXT_RELEV_PHRASE | denplusplus,gulin,leo | alsafr,gulin,leo | Приоритет phrase для TR - текстовый приоритет - есть все слова запроса подряд в документе. | 97 | |||||||||||||||
7 | 6 | LRp1 | (strict) has all query words in one link. | Dynamic | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED | FI_LINK_RELEV_ALL_WORDS | gulin,leo | gulin,leo | (strict) есть все слова запроса в одном линке. | 41 | |||||||||||||||
8 | 7 | LRp2 | (phrase) have all query words in a row in one link. | Dynamic | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED | FI_LINK_RELEV_PHRASE | gulin,leo | gulin,leo | (phrase) есть все слова запроса подряд в одном линке. | 51 | |||||||||||||||
9 | 8 | TRtitle | The presence of the exact phrase (query text) in the title (to be exact, in the first sentence of the document). Context constraints and stop words are taken into account exactly as in TRp2, i.e. factor[8] minors factor 5 | LegacyTR | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE | FI_TEXT_RELEV_TITLE | denplusplus,gulin,leo | alsafr,gulin,leo | Наличие точной фразы (текста запроса) в заголовке (если точнее, в первом предложении документа). Контекстные ограничения и стоп слова учитываются в точности как в TRp2, т.е. factor[8] minors factor 5 | 221 | |||||||||||||||
10 | 9 | TRhr | A quorum site was encountered in which all word positions are marked as having BEST_RELEV relevance (header or meta keywords). | LegacyTR | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE | FI_TEXT_RELEV_WHOLE_HR_MATCHED | gulin,leo | gulin,leo | Встретился участок, прошедший кворум, в котором все словопозиции обозначены как имеющие релевантность BEST_RELEV (заголовок или meta keywords). | 126 | |||||||||||||||
11 | 11 | News | This is news (determined by the distinctive ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-3 patterns in url`) ). | TG_HOST, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE | FI_NEWS | gulin | gulin | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-3 | Это новости (определяется по характерным ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-3 паттернам в url`е)) ). | 183 | |||||||||||||||
12 | 12 | Shop | This is a store offer (defined by the characteristic ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-4 patterns in url`)) ). Not used (deprecated) | TG_HOST, TG_STATIC, TG_BINARY, TG_DEPRECATED, TG_OFTEN_ZERO | FI_SHOP | gulin | gulin | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-4 | Это магазин предложение (определяется по характерным ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-4 паттернам в url`е)) ). Не используется (deprecated) | 1 | 215 | ||||||||||||||
13 | 13 | Cat | This is a catalog (determined by the characteristic ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-2 patterns in url`)) or by the Yandex catalog). | TG_HOST, TG_STATIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE | FI_CATALOG | gulin | gulin | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-2 | Это каталог (определяется по характерным ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-2 паттернам в url`е)) или по яндекс-каталогу). | 1 | 216 | ||||||||||||||
14 | 14 | YaBar | Attendance from Bar - ((wiki.yandex-team.ru/AndrejjKostjagin/YaBarLog/HostStat Data Description)). Factor remap. | TG_BROWSER, TG_HOST, TG_STATIC, TG_USER, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_VISITS_ACTIVITY_DOWNLOADS, TG_USERFEAT | FI_YA_BAR | kostyagin,somov | tarum,niknik | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/YaBar | Посещаемость из Бара - ((wiki.yandex-team.ru/AndrejjKostjagin/YaBarLog/HostStat Описание данных)). Фактор ремапится. | 1 | 112 | ||||||||||||||
15 | 15 | Long | Long document (the longer the document, the greater the value of the factor). | TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE | FI_LONG | gulin | gulin | Длинный документ (чем длиннее документ, тем больше значение фактора). | 77 | ||||||||||||||||
16 | 16 | TRhitw | Hitweigt is a variant of textual relevance, in which the weights of all hits are considered equal (i.e. no premiums for title and word proximity are taken into account). In this case the relevant hits must pass the constraints of the syntactic wizard, i.e. we can assume that the TRhitw factor is 0 if and only if SoftAndOk is 0 | LegacyTR | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_REARR_USE, TG_NN_OVER_FEATURES_USE | FI_HIT_WEIGHT | gulin,leo | gulin,leo | Hitweigt - вариант текстовой релевантности, в которой веса всех хитов считаются равными (т.е. не учитывают надбавки за title и за близость слов). При этом соответствующие хиты должны пройти ограничения синтаксического колдунщика, т.е. можно считать, что фактор TRhitw равен 0 тогда и только тогда, когда SoftAndOk равен 0 | 328 | |||||||||||||||
17 | 17 | LongQuery | The sum of the idf of the query words. The name does not reflect the essence: for example, for the query 'Gadyach' this factor will be greater than for the query 'Moscow Peter Yekaterinburg Samara'. | Query | TG_QUERY_ONLY, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_L3_OVERWRITE, TG_NN_OVER_FEATURES_USE | FI_LONG_QUERY | gulin | gulin | Сумма idf слов запроса. Название не отражает суть: например, для запроса 'Гадяч' этот фактор будет больше, чем для запроса 'Москва Питер Екатеринбург Самара'. | 198 | |||||||||||||||
18 | 18 | PureText | Long text without references. | TG_BINARY, TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE | FI_PURE_TEXT | leo | tsimkha,leo | https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/LongText | Длинный текст без ссылок. | 29 | |||||||||||||||
19 | 19 | Root | It's a muzzle. | TG_BINARY, TG_DOC, TG_STATIC, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE | FI_ROOT | gulin | gulin,tsimkha | https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/Root | Это морда. | 1 | 14 | ||||||||||||||
20 | 22 | Geo | Indicates a match between the user's region and the site at the country level. The factor is binary: 1-match, 0-no-match. Based on ((wiki.yandex-team.ru/YandexSearch/SiteSiteCategorization/Geographic/UseSiteGeoclassification)) | TG_DYNAMIC, TG_LOCALIZED_COUNTRY, TG_HOST, TG_BINARY, TG_DEPRECATED, TG_UNDOCUMENTED, TG_OFTEN_ZERO | FI_GEO | ark-kum,gulin,maslov | ark-kum,gulin,maslov | Означает совпадение региона пользователя и сайта на уровне стран. Фактор бинарный: 1-совпадает, 0-нет. Основан на ((wiki.yandex-team.ru/ЯндексПоиск/КлассификацияСайтовИСтраниц/Географическая/ИспользованиеВПоиске геоклассификации сайтов)) | 226 | ||||||||||||||||
21 | 23 | SubqueryThMatch | Matching thematic spectra of the query and the document. The subject of the query is the result of ((wiki.yandex-team.ru/EvgenijjKroxalev/subquery rules wizard SubquerySearch )) The subject of the document is taken from the Yandex catalog | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_THEME_CLASSIF, TG_UNDOCUMENTED, TG_L2, TG_DEPRECATED | FI_SUBQUERY_THEME_MATCH | abokov,ekrokhalev,gulin | gulin,lamo | Совпадение тематических спектров запроса и документа. Тематика запроса - результат работы ((wiki.yandex-team.ru/EvgenijjKroxalev/subquery правила колдунщика SubquerySearch )) Тематика документа берется из яндекс-каталога | 238 | ||||||||||||||||
22 | 24 | SR | A complex static rank, assembled from static components using a separate formula ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/#oftnd1 *)). | TG_DOC, TG_STATIC, TG_TRANS, TG_UNDOCUMENTED, TG_UNUSED | FI_SR | gulin,somov | gulin,somov | Сложносоставной static rank, собирается из статических компонентов по отдельной формуле((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/#oftnd1 *)). | 179 | ||||||||||||||||
23 | 25 | TRref | Factor about the number of refines. The query language has a user refines ('word preceded by a percent sign') feature. This is supposed to mean something like 'it would be nice to have a word in the document'. The only known ((http://staff.yandex-team.ru/gulin Andrey Gulin)) valuable use of this feature is querying [%official %site FirmName]. This feature is unknown to users, since it is not described in any documentation. It is planned that it will disappear from the query language, but the words with USER_REFINE priority will remain in the wizard. The factor tells you how many maximum USER_REFINE words were encountered simultaneously within a single quorum hit. It is said to be between 0 and 3 (if >3, it is said to be 3). This number is mapped to the half-interval [0,1) | LegacyTR | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE | FI_REFINES | gulin,leo | gulin,leo | Фактор про число refines. В языке запросов есть фича user refines ('слово, перед которым стоит знак процентика'). По задумке это означает что-то вроде 'хорошо бы, чтобы слово в документе было'. Единственное известное ((http://staff.yandex-team.ru/gulin Андрей Гулин)) ценное использование данной фичи - это запрос [%официальный %сайт НазваниеФирмы]. Пользователям данная фича неизвестна, т.к. не описана ни в какой документации. Планируется, что она исчезнет из языка запросов, но в колдунщике слова с приоритетом USER_REFINE останутся. Фактор говорит о том, сколько максимум USER_REFINE-слов одновременно встречалось в рамках единого попадания в кворум. Считается, что их от 0 до 3 (если >3, то считается, что 3). Это число мапится в полуинтервал [0,1) | 782 | |||||||||||||||
24 | 26 | TRboost | The number by which some link factors (namely, factors number 6, 7, 47, 66) are multiplied if the text relevance is 0 and there are few links | Dynamic | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE | FI_TR_BOOST | gulin | gulin | Число, на которое умножаются некоторые линковые факторы (именно, факторы номер 6, 7, 47, 66), если текстовая релевантность 0, и ссылок мало | 141 | |||||||||||||||
25 | 27 | TRLRlemma | In textual relevance, a lemma match occurred. | Dynamic | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_SAMOHOD_UNIMPLEMENTED, TG_CALLISTO_UNIMPLEMENTED, TG_NN_OVER_FEATURES_USE | FI_TRLR_LEMMA | gulin,leo | gulin,leo | В текстовой релевантности произошло совпадение леммы. | 45 | |||||||||||||||
26 | 28 | TrafgraphOutAll_share_d | Remapped mascot feature TrafgraphOutAll_share_d | SEARCHSPAM-15531 | TG_OWNER, TG_STATIC, TG_OFTEN_ZERO, TG_COMMERCIAL, TG_NN_OVER_FEATURES_USE | FI_TRAFGRAPH_OUT_ALL_SHARE_D | bikulov | bikulov,sdormidontov | 2020-09-30 | Remapped mascot feature TrafgraphOutAll_share_d | 47 | ||||||||||||||
27 | 29 | RelevSentsDssm | Dssm model, trained on reformulations, uses relevant sentences in the document part | FACTOR-2259 | TG_DYNAMIC, TG_DOC, TG_DOC_TEXT, TG_NEURAL, TG_NN_OVER_FEATURES_USE | FI_RELEV_SENTS_DSSM | padese | padese | 2020-03-03 | DssmRelevSents | Dssm модель, обучена на переформулировки, в документной части использует релевантные запросу предложения | 83 | |||||||||||||
28 | 30 | FreshNewsDetectorPredict | The value of the news detector calculated in behemoth. Always 0 when the detector value is less than the threshold. | WEBFRESH-478 | TG_DYNAMIC, TG_QUERY_ONLY, TG_USER, TG_FRESHNESS_USE, TG_L2, TG_QUERY_DETECTOR_PREDICT, TG_UNUSED, TG_NOT_01 | FI_FRESH_NEWS_DETECTOR_PREDICT | alejes,hygge | alejes,hygge | 2020-09-27 | -3.00E+38 | 3.00E+38 | Значение детектора новостей, рассчитываемого в бегемоте. Всегда 0 при значении детектора меньше порога. | 115 | ||||||||||||
29 | 31 | LRHitNum100 | The converted number of query words in all url links. | LegacyLR | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED | FI_HIT_NUM_100 | leshch | alsafr | Преобразованное количество слов запроса во всех линках url`а. | 53 | |||||||||||||||
30 | 32 | LRHitNumGt16 | The document LR>20 has the number of occurrences of the query words in the links > 16, factor about LR. | LegacyLR | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_DEPRECATED | FI_HIT_NUM_GT_16 | leshch | alsafr | У документа LR>20 количество вхождение слов запроса в линках > 16, фактор про LR. | 103 | |||||||||||||||
31 | 33 | PctLinks | For documents with high LR - normalized link relevance without regard to proximity, for documents with low LR 0 | LegacyLR | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED | FI_PCT_LINKS | leshch | alsafr | Для документов с высокой LR - нормированная линковая релевантность без учета близости, для документов с низкой LR 0 | 111 | |||||||||||||||
32 | 34 | HasLR | Url high LR. | LegacyLR | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED | FI_HAS_LR | denplusplus | alsafr | Url высокую LR. | 12 | |||||||||||||||
33 | 35 | LinkQuality | Quality of incoming references (Leschiner's classifier) - broken, see [405] | TG_DOC, TG_LINK_TEXT, TG_STATIC, TG_DEPRECATED, TG_L2 | FI_LINK_QUALITY | leshch | alsafr | Качество входящих ссылок (классификатор Лещинера) - сломан, см [405] | 75 | ||||||||||||||||
34 | 36 | AliceMusicTrackTitleCosineMatchMaxPrediction | CosineMatchMaxPrediction factor value for the AliceMusic stream | BUKI-2932 | TG_UNUSED, TG_DYNAMIC, TG_DOC, TG_ALICE_MUSIC, TG_ANNOTATION_NOFILTER, TG_TEXT_MACHINE, TG_ALLOW_USE_FOR_ALICE | FI_ALICE_MUSIC_TRACK_TITLE_COSINE_MATCH_MAX_PREDICTION | anrodigina | anrodigina,gotmanov,hommforever | 2020-03-11 | https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/lingboost | Значение фактора CosineMatchMaxPrediction для стрима AliceMusic | 63 | |||||||||||||
35 | 37 | NumLinks | Number of incoming links. Remaps. | TG_DOC, TG_LINK_GRAPH, TG_STATIC, TG_L2, TG_UNUSED | FI_NUM_LINKS | tsimkha,alsafr | https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/NumLinks | Число входящих ссылок. Ремапится. | 33 | ||||||||||||||||
36 | 38 | PopularQ | Popularity of the request | Query | PopularQ | begemot_query_factors | TG_DYNAMIC, TG_QUERY_ONLY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_REARR_USE, TG_L2, TG_DEPRECATED | FI_POPULAR_Q | denplusplus | diver,akhropov | https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/PopularQ | Популярность запроса | 25 | ||||||||||||
37 | 39 | TRUnmapped | TR divided by the cube of the number of words in the query and converted by the standard remapTR. | LegacyTR | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE | FI_TR_UNMAPPED | denplusplus,gulin | alsafr,gulin | TR деленный на куб количества слов в запросе и преобразованный стандартным remapTR. | 97 | |||||||||||||||
38 | 40 | RusLang | The language of the document is Russian. | TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE | FI_RUS_LANG | aalekseev,denplusplus | alsafr | Язык документа - русский. | 40 | ||||||||||||||||
39 | 41 | AddTime | Time of page addition, more is an older document; put the root of the time mapped to the interval -[0,1] so that 3+ years gives 1- | TG_DATE, TG_DOC, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_ADD_TIME | aalekseev,denplusplus | alsafr | Время добавления страницы, больше - более старый документ; кладется корень из времени, отображенный на интервал -[0,1] так, чтобы 3+ года давало 1- | 130 | ||||||||||||||||
40 | 42 | IsMainPage | If the main page of the owner (most often a second-level domain, such as xxxx.ru), the factor is 1. For bomzhatniki, hosting, personal blogs, etc. (eg, Lyfjornal, narod.ru, etc.) - third-level domains (such as xxxxx.narod.ru) will also have a factor of 1. | TG_DOC, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE | FI_IS_MAIN_PAGE | aalekseev,denplusplus | alsafr | Если главная страница владельца (чаще всего домен второго уровня, например xxxx.ru), то фактор равен 1. Для бомжатников, хостингов, личных блогов и т.д. (например, лайфджорнал, народ.ру и пр.) - домены третьего уровня (типа xxxxx.narod.ru) так же будут иметь фактор равный 1. | 255 | ||||||||||||||||
41 | 43 | AddTimeMP | The owner (host?) main page addition time, remaps in the same way as AddTime. | TG_DATE, TG_HOST, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_ADD_TIME_MP | aalekseev,denplusplus | alsafr | Время добавления главной страницы владельца (хоста?), ремапится так же, как AddTime. | 1 | 77 | |||||||||||||||
42 | 44 | AliceMusicTrackTitleAnnotationMaxValueWeighted | The value of the AnnotationMaxValueWeighted factor for the AliceMusic streamer | BUKI-2932 | TG_UNUSED, TG_DYNAMIC, TG_DOC, TG_ALICE_MUSIC, TG_ANNOTATION_NOFILTER, TG_TEXT_MACHINE, TG_ALLOW_USE_FOR_ALICE | FI_ALICE_MUSIC_TRACK_TITLE_ANNOTATION_MAX_VALUE_WEIGHTED | anrodigina | anrodigina,gotmanov,hommforever | 2020-03-11 | https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/lingboost | Значение фактора AnnotationMaxValueWeighted для стрима AliceMusic | 78 | |||||||||||||
43 | 45 | QueryURLClicksPCTR | How often the URL is clicked on this query - CTR multiplied by the correction factor | CNT_RELEV | TG_DYNAMIC, TG_DOC, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATED | FI_URL_CLICKS_PCTR | akhropov,solar | tarum,niknik | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#queryurldownerclickspctrfrccomboreg | Насколько часто кликают в данный URL по данному запросу - CTR домноженный на поправочный коэффициент | 0.6 | 84 | |||||||||||||
44 | 46 | TextBM25 | Simple BM25 by text. | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_BM25 | gulin | gulin | Простой BM25 по тексту. | 20 | |||||||||||||||
45 | 47 | LinkBM25 | Simple BM25 by links, link weights are not taken into account. | LinkBM25 & Dynamic | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_DEPRECATED | FI_LINK_BM25 | gulin | gulin | Простой BM25 по линкам, веса линков не учитываются. | 62 | |||||||||||||||
46 | 48 | TLBM25 | Simple BM25 by text and links at the same time. | TextAndLinkBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_L2, TG_DEPRECATED | FI_TLBM25 | gulin | gulin | Простой BM25 по тексту и линкам одновременно. | 47 | |||||||||||||||
47 | 49 | TLp1 | All query words are in the text + links. | TextAndLinkBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_L2, TG_DEPRECATED | FI_TLP1 | gulin | gulin | Все слова запроса есть в тексте + линках. | 40 | |||||||||||||||
48 | 50 | Adv | There are ads on the site. | TG_OWNER, TG_STATIC, TG_BINARY, TG_DEPRECATED, TG_OFTEN_ZERO | FI_ADV | aalekseev,denplusplus | sisoid,alsafr | На сайте есть реклама. | 26 | ||||||||||||||||
49 | 51 | YandexAdv | There are Yandex ads on the site. | TG_OWNER, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_DEPRECATED, TG_OFTEN_ZERO | FI_YANDEX_ADV | aalekseev,denplusplus | sisoid,alsafr | На сайте есть реклама Яндекса. | 1 | 33 | |||||||||||||||
50 | 52 | NoSpam | Spam classifier by anti-spam chips recognized the site as NOT(!) spam. I.e. 0=spam, 1=good. | TG_OWNER, TG_STATIC, TG_THEME_CLASSIF, TG_REARR_USE, TG_DEPRECATED | FI_NO_SPAM | aalekseev,denplusplus | alsafr | Классификатор спама по фичам из антиспама признал сайт НЕ(!) спамом. Т.е. 0=спам, 1=хороший. | 1 | 91 | |||||||||||||||
51 | 53 | TxtPair | Simple BM25 by word pairs - we take all pairs of query words and count the number of their occurrences in the text of the document. We use sum of word weights as pair weight. Comm Doesn't work if query has stop word | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_PAIR | gulin | gulin | Простой BM25 по парам слов - берем все пары слов запроса и считаем число их вхождений в текст документа. В качества веса пары используем сумму весов слов. Комм Не работает, если в запросе есть стоп-слово | 215 | |||||||||||||||
52 | 54 | LnkPair | Same as TxtPair, but for links; link weights are not taken into account. | LinkBM25 | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_L2, TG_DEPRECATED | FI_LINK_PAIR | gulin | gulin | То же, что TxtPair, но для линков; веса линков не учитываются. | 72 | |||||||||||||||
53 | 55 | TxtBreak | BM25 from the number of sentences in the document in which it occurs. | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_BREAK | gulin | gulin | BM25 от количества предложений в документе, в которых встречается. | 69 | |||||||||||||||
54 | 56 | TxtHead | BM25 by the words in the title only. | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_HEAD | gulin | gulin | BM25 по словам только в заголовке. | 36 | |||||||||||||||
55 | 57 | TxtHiRel | BM25 on words only with high rel bits ('significant', with highlighting (<b>, etc.)). | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_HI_RELEV | gulin | gulin | BM25 по словам только с high rel-битиками ('значимым', с выделением (<b> итп)). | 85 | |||||||||||||||
56 | 59 | WordCount | Min(number of query words/10, 1.f) | Query | TG_QUERY_ONLY, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_WORD_COUNT | denplusplus,gulin | alsafr,gulin | Min(число слов запроса/10, 1.f) | 34 | |||||||||||||||
57 | 60 | InvWordCount | 1 / number_words_in_request. | Query | TG_DYNAMIC, TG_QUERY_ONLY, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_INV_WORD_COUNT | denplusplus,gulin | alsafr,gulin | 1 / количество_слов_в_запросе. | 28 | |||||||||||||||
58 | 61 | HasNoTR | The document has no TR. | LegacyTR | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE | FI_HAS_NO_TR | denplusplus,gulin | alsafr,gulin | 1 | У документа нет TR. | 23 | ||||||||||||||
59 | 62 | HasNoLR | The document has no LR. | LegacyLR | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED | FI_HAS_NO_LR | denplusplus,gulin | gulin,alsafr | 1 | У документа нет LR. | 23 | ||||||||||||||
60 | 63 | HasNoQueryURLShows | There is no information about clickability for this url for this request 1 - request or request-url is not in the clickbase, 0 - request-url is in the clickbase | CNT_RELEV | TG_DYNAMIC, TG_DOC, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_BINARY, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATED | FI_HAS_NO_QUERY_URL_SHOWS | denplusplus,kostyagin | tarum,niknik | 1 | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#hasnoqueryurldownershows | Для данного урла для данного запроса нет информации о кликабельности 1 - запроса или запроса-urla нет в базе кликов, 0 - запрос-url есть в базе кликов | 1 | 160 | ||||||||||||
61 | 64 | HasNoQueryShows | For this query there is no information about clickability 1 - the query is not in the clickbase, 0 - the query is in the clickbase. | CNT_RELEV | TG_DYNAMIC, TG_QUERY_ONLY, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_USER_SEARCH_EXTERNAL, TG_BINARY, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATED | FI_HAS_NO_QUERY_SHOWS | denplusplus,kostyagin,akhropov | tarum,niknik | 1 | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#hasnoqueryshows | Для данного запроса нет информации о кликабельности 1 - запроса нет в базе кликов, 0 - запрос есть в базе кликов. | 131 | |||||||||||||
62 | 65 | Hops | The number of hops of the url in a roundtrip (like less - closer to the muzzle, the smaller the value (0 - muzzle, 1 - cannot be reached from the muzzle, 0 < can be reached from the muzzle < 1). Normal value for nost root is 0.0039). | TG_DOC, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_HOPS | denplusplus | alsafr | Количество хопов урла в обходе (типа меньше - ближе к морде, тем меньше значение (0 - морда, 1 - с морды добраться нельзя, 0 < можно добраться с морды < 1). Нормальное значение для корня носта 0.0039). | 233 | ||||||||||||||||
63 | 66 | LogLR | The logarithm of LR, linearly mapped in [0,1] | Dynamic | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED | FI_LOG_LR | denplusplus,karpik | alsafr | Логарифм от LR, линейно отображенный в [0,1] | 0.85 | 45 | ||||||||||||||
64 | 67 | TxtPairEx | presence of word pairs in exact form | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_PAIR_EX | alsafr | наличие пар слов по точной форме | 36 | ||||||||||||||||
65 | 68 | TxtBreakEx | the number of sentences in which there are many words in the exact form | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_BREAK_EX | alsafr | количество предложений, в которых встречается много слов по точной форме | 71 | ||||||||||||||||
66 | 69 | TxtHeadEx | the presence of words in the title in the exact form | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_HEAD_EX | alsafr | наличие слов в заголовке по точной форме | 52 | ||||||||||||||||
67 | 70 | TxtHiRelEx | BM25 in exact form | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_HI_RELEV_EX | alsafr | BM25 по точной форме | 18 | ||||||||||||||||
68 | 71 | TxtBm25Ex | A simple BM25 in precise form. | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_BM25_EX | alsafr | Простой BM25 по точной форме. | 30 | ||||||||||||||||
69 | 72 | TxtPairSy | presence of word pairs with synonyms (>=TxtPair) | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_PAIR_SYN | alsafr | наличие пар слов c учетом синонимов (>=TxtPair) | 48 | ||||||||||||||||
70 | 73 | TxtBreakSy | the number of sentences in which there are many words with synonyms taken into account | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_BRAEK_SYN | alsafr | количество предложений, в которых встречается много слов c учетом синонимов | 86 | ||||||||||||||||
71 | 74 | TxtHeadSy | the presence of words in the title, taking into account synonyms | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_REARR_USE, TG_NN_OVER_FEATURES_USE | FI_TEXT_HEAD_SYN | alsafr | наличие слов в заголовке c учетом синонимов | 64 | ||||||||||||||||
72 | 75 | TxtHiRelSy | BM25 including synonyms | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_HI_RELEV_SYN | alsafr | BM25 c учетом синонимов | 23 | ||||||||||||||||
73 | 76 | TxtBm25Sy | Simple BM25 with synonyms in mind. | TextBM25 | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_BM25_SYN | alsafr | Простой BM25 c учетом синонимов. | 34 | ||||||||||||||||
74 | 77 | QueryDOwnerClicksPCTR | How often the URLs of the given domainId are clicked on the given query - CTR domainId multiplied by the correction factor | CNT_RELEV | TG_DYNAMIC, TG_DOWNER, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_USER_SEARCH_EXTERNAL, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATED | FI_QUERY_DOWNER_CLICKS_PCTR | akhropov,solar,denplusplus | tarum,niknik | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#queryurldownerclickspctrfrccomboreg | Насколько часто кликают в URLы данного domainId по данному запросу - CTR domainId домноженный на поправочный коэффициент | 122 | ||||||||||||||
75 | 78 | HasNoQueryDOwnerShows | For this domainId for this query there is no information about clickability 1 - request or request-owner is not in the clickbase, 0 - request-owner is in the clickbase | CNT_RELEV | TG_DYNAMIC, TG_DOWNER, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_USER_SEARCH_EXTERNAL, TG_BINARY, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATED | FI_HAS_NO_QUERY_DOWNER_SHOWS | denplusplus,kostyagin | tarum,niknik | 1 | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#hasnoqueryurldownershows | Для данного domainId для данного запроса нет информации о кликабельности 1 - запроса или запроса-владельца нет в базе кликов, 0 - запрос-владелец есть в базе кликов | 167 | |||||||||||||
76 | 79 | OwnerClicksPCTR | Clickability of the owner regardless of the request | TG_STATIC, TG_OWNER, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_OFTEN_ZERO, TG_L2, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATED | FI_OWNER_CLICKS_PCTR | akhropov,maslov | tarum,niknik | https://wiki.yandex-team.ru/ЯндексПоиск/КачествоПоиска/Клики#ownerclickspctrreg | Кликабельность владельца независимо от запроса | 51 | |||||||||||||||
77 | 80 | Megafon | Relative frequency of query words in links (1 - query words often occur in links, 0.3 - rarely); more precisely, the value of this factor is pessimized if: TR=0 && LR=0 && (no links with all query words) && (no quorum) && (at least one pair of query words occurs in the text) | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_UNUSED | FI_MEGAFON | alsafr | Относительная частота слов запроса в ссылках (1 - слова запроса часто встречаются в ссылках, 0.3 - редко); если точнее, значение этого фактора пессимизируется при условии: TR=0 && LR=0 && (нет ни одной ссылки со всеми словами запроса) && (не прошёл кворум) && (в тексте встречается хотя бы одна пара слов запроса) | 275 | |||||||||||||||||
78 | 81 | XLRp0 | The links have all the words of the query | Xref | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED | FI_HAS_ALL_WORDS_MERGED | alsafr | В ссылках есть все слова запроса | 41 | ||||||||||||||||
79 | 82 | XLRp1 | One link has all the words of the query | Xref | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED | FI_HAS_ALL_WORDS_IN_LINK | alsafr | В одной ссылке есть все слова запроса | 39 | ||||||||||||||||
80 | 83 | XLRp2 | There is a link that passed the quorum | Xref | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED | FI_PHRASE | alsafr | Есть ссылка, прошедшая кворум | 38 | ||||||||||||||||
81 | 84 | XLRgood | What proportion of links are "good" | Xref | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_REARR_USE, TG_UNDOCUMENTED, TG_DEPRECATED | FI_GOOD_RATIO | alsafr | Какая доля ссылок “хорошая” | 35 | ||||||||||||||||
82 | 85 | XLRmanyBad | How many "bad" links (bad = dpr = 0) | Xref | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED | FI_MANY_BAD | alsafr | Насколько много “плохих” ссылок (плохой = dpr = 0) | 1 | 36 | |||||||||||||||
83 | 86 | XLRmaxDpr | Maximum dpr reference | Xref | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED | FI_LR_MAX_DPR | alsafr | Максимальный dpr ссылки | 21 | ||||||||||||||||
84 | 87 | XLRtfidf | TfIdf is usual TF*IDF by links. The word frequency in the references is multiplied by the inverse document frequency and summed over all words, then normalized to the document length. | Xref | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED | FI_LR_TF_IDF | alsafr | TfIdf обычный TF*IDF по ссылкам. Частота слова в ссылках умножается на обратную документную частоту и суммируется по всем словам, потом нормируется на длину документа. | 183 | ||||||||||||||||
85 | 88 | XLRrelev | Link relevance by Gulin | Xref | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED | FI_LR_RELEV | gulin | gulin | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/OpisanijaFaktorov#h20931-2 | Линковая релевантность от Гулина | 23 | ||||||||||||||
86 | 89 | XLRrelev200 | Link relevance by Gulin | Xref | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED | FI_LR_RELEV_200 | gulin | gulin | Линковая релевантность от Гулина | 23 | |||||||||||||||
87 | 90 | XLRlogRelev | Link relevance by Gulin | Xref | TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED | FI_LR_LOG_RELEV | gulin | gulin | Линковая релевантность от Гулина | 23 | |||||||||||||||
88 | 91 | BFexact | There is an exact form of all query words in the text/links | BestForm | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_DEPRECATED | FI_BF_EXACT | alsafr | Есть точная форма всех слов запроса в тексте/линках | 59 | ||||||||||||||||
89 | 92 | BFlemma | There is a lemma of all query words in the text/links | BestForm | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_DEPRECATED | FI_BF_LEMMA | alsafr | Есть лемма всех слов запроса в тексте/линках | 53 | ||||||||||||||||
90 | 93 | SoftAndOk | The document passed softand by the syntax wizard's constraints. Only for documents with textual relevance. For single-word queries it is always 1. | Dynamic | TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE | FI_SOFT_AND_OK | alsafr | Документ прошел softand по ограничениям синтаксического колдунщика. Только для документов, имеющих текстовую релевантность. Для однословных запросов всегда 1. | 146 | ||||||||||||||||
91 | 94 | NewLinkQuality | Incoming link quality classifier 2 - broken, see [407] | TG_DOC, TG_LINK_GRAPH, TG_STATIC, TG_DEPRECATED | FI_NEW_LINK_QUALITY | alsafr | Классификатор качества входящих ссылок 2 - сломан, см [407] | 54 | |||||||||||||||||
92 | 95 | Ukrainian | equals one if the site has a Ukrainian geo-attribute (ie, 1 - Ukrainian site) | TG_STATIC_REGINFO, TG_HOST, TG_STATIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE | FI_UKR | alsafr | равен единице, если у сайта стоит украинский гео-атрибут(т.е 1 - украинский сайт) | 77 | |||||||||||||||||
93 | 96 | IsBlog | Bloghosting page | TG_HOST, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE | FI_IS_BLOG | burmisha,zudina | burmisha,zudina | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-5 | Страница с блогохостинга | 16 | |||||||||||||||
94 | 97 | IsLivejournal | Page from livejournal.com | TG_HOST, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE | FI_IS_LJ | alsafr | Страница с livejournal.com | 25 | |||||||||||||||||
95 | 99 | Spam2 | Alexeyev's automatic spam classifier, probability that the site is spam (0 not spam, 1-spam) | TG_OWNER, TG_STATIC, TG_THEME_CLASSIF, TG_DEPRECATED | FI_SPAM2 | abv | abv | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/OpisanijaFaktorov#h20931-3 | Автоматичемкий классификатор спама им. Алексеева, вероятность того, что сайт спам (0 не спам, 1- спам) | 1 | 92 | ||||||||||||||
96 | 100 | TextFeatures | Text quality. Calculated according to a rather complicated formula | TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_FEATURES | alsafr | Качество текста. Считается по довольно сложной формуле | 66 | |||||||||||||||||
97 | 101 | TextLike | Text quality (Alekseev's classifier) | TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE | FI_TEXT_LIKE | alsafr | Качество текста (классификатор Алексеева) | 36 | |||||||||||||||||
98 | 104 | YaBarCoreOwner | The core audience of owners according to Yandex.Browsing | TG_STATIC, TG_OWNER, TG_USER, TG_BROWSER, TG_L2, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_VISITS_ACTIVITY_DOWNLOADS | FI_YABAR_CORE_OWNER | monster | tarum,niknik | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/userbrowsingactions/coreaudience/ | Ядро аудитории владельцев по данным Яндекс.Браузинга | 56 | |||||||||||||||
99 | 105 | YaBarCoreHost | Host audience kernel according to Yandex.Browsing | TG_STATIC, TG_HOST, TG_USER, TG_BROWSER, TG_REARR_USE, TG_L2, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_VISITS_ACTIVITY_DOWNLOADS | FI_YABAR_CORE_HOST | kostyagin | tarum,niknik | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/userbrowsingactions/coreaudience/ | Ядро аудитории хостов по данным Яндекс.Браузинга | 49 | |||||||||||||||
100 | 106 | HasYaBarCore | Does the host have a kernel | TG_STATIC, TG_HOST, TG_USER, TG_BROWSER, TG_BINARY, TG_OFTEN_ZERO, TG_L2, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_VISITS_ACTIVITY_DOWNLOADS | FI_HAS_YA_BAR_CORE | kostyagin | tarum,niknik | https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/userbrowsingactions/coreaudience/ | Имеет ли хост ядро | 1 | 27 |