ABCDEFGHIJKLMNOPQRSTUVWXY
1
0PRPage rank. The factor is remapped.
TG_DOC, TG_LINK_GRAPH, TG_STATIC, TG_L2, TG_UNUSED
FI_PAGE_RANKaavdonkinaavdonkin
https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/PageRank
Page rank. Фактор ремапится.
134
2
1TR
Textual relevance (maxfreq - the frequency of the most frequent word, which makes sense of the length of the document).
LegacyTR
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE
FI_TEXT_RELEV
gulin,iseg,leo,maslov
gulin,leo,maslov
Текстовая релевантность (maxfreq – частота самого частого слова, которая имеет смысл длины документа).
0.95119
3
2LRLink Relevance. The factor is remapped.Dynamic
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED
FI_LINK_RELEV
aavdonkin,gulin,leshch,melkov
aavdonkin,gulin,melkov
Линковая релевантность. Фактор ремапится.
139
4
3PrBonus
Priority bonus, priority 7 - text priority. Factor is binary, has value 0 for all single word queries, and value 1 for almost all two or more word queries, except for a very small number of responses, for which there are no links that passed the quorum, and the text did not pass the quorum either.
Dynamic
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE
FI_PAGE_RANK_BONUS
gulin,leopavelgur
https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/PageRankBonus
Priority bonus, приоритет 7 - текстовый приоритет. Фактор бинарный, имеет значение 0 для всех однословных запросов, и значение 1 практически для всех двух и более словных, кроме очень маленького количества ответов, для которых нет ни одной ссылки, прошедшей кворум, и текст тоже не прошел кворум.
298
5
4TRp1
Priority strict for TR is text priority - there are all query words somewhere in the document (and they pass contextual restrictions of the query, for example, both words d.b. in the same sentence).
LegacyTR
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE
FI_TEXT_RELEV_ALL_WORDS
denplusplus,gulin,leo
alsafr,gulin,leo
Приоритет strict для TR - текстовый приоритет - есть все слова запроса где-то в документе (при этом они проходят контекстные ограничения запроса, например, оба слова д.б. в одном предложении).
198
6
5TRp2
The phrase priority for TR is text priority - there are all query words in a row in the document.
LegacyTR
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_REARR_USE, TG_NN_OVER_FEATURES_USE
FI_TEXT_RELEV_PHRASE
denplusplus,gulin,leo
alsafr,gulin,leo
Приоритет phrase для TR - текстовый приоритет - есть все слова запроса подряд в документе.
97
7
6LRp1(strict) has all query words in one link.Dynamic
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED
FI_LINK_RELEV_ALL_WORDS
gulin,leogulin,leo
(strict) есть все слова запроса в одном линке.
41
8
7LRp2(phrase) have all query words in a row in one link.Dynamic
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED
FI_LINK_RELEV_PHRASE
gulin,leogulin,leo
(phrase) есть все слова запроса подряд в одном линке.
51
9
8TRtitle
The presence of the exact phrase (query text) in the title (to be exact, in the first sentence of the document). Context constraints and stop words are taken into account exactly as in TRp2, i.e. factor[8] minors factor 5
LegacyTR
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE
FI_TEXT_RELEV_TITLE
denplusplus,gulin,leo
alsafr,gulin,leo
Наличие точной фразы (текста запроса) в заголовке (если точнее, в первом предложении документа). Контекстные ограничения и стоп слова учитываются в точности как в TRp2, т.е. factor[8] minors factor 5
221
10
9TRhr
A quorum site was encountered in which all word positions are marked as having BEST_RELEV relevance (header or meta keywords).
LegacyTR
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE
FI_TEXT_RELEV_WHOLE_HR_MATCHED
gulin,leogulin,leo
Встретился участок, прошедший кворум, в котором все словопозиции обозначены как имеющие релевантность BEST_RELEV (заголовок или meta keywords).
126
11
11News
This is news (determined by the distinctive ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-3 patterns in url`) ).
TG_HOST, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE
FI_NEWSgulingulin
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-3
Это новости (определяется по характерным ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-3 паттернам в url`е)) ).
183
12
12Shop
This is a store offer (defined by the characteristic ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-4 patterns in url`)) ). Not used (deprecated)
TG_HOST, TG_STATIC, TG_BINARY, TG_DEPRECATED, TG_OFTEN_ZERO
FI_SHOPgulingulin
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-4
Это магазин предложение (определяется по характерным ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-4 паттернам в url`е)) ). Не используется (deprecated)
1215
13
13Cat
This is a catalog (determined by the characteristic ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-2 patterns in url`)) or by the Yandex catalog).
TG_HOST, TG_STATIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE
FI_CATALOGgulingulin
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-2
Это каталог (определяется по характерным ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-2 паттернам в url`е)) или по яндекс-каталогу).
1216
14
14YaBar
Attendance from Bar - ((wiki.yandex-team.ru/AndrejjKostjagin/YaBarLog/HostStat Data Description)). Factor remap.
TG_BROWSER, TG_HOST, TG_STATIC, TG_USER, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_VISITS_ACTIVITY_DOWNLOADS, TG_USERFEAT
FI_YA_BARkostyagin,somovtarum,niknik
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/YaBar
Посещаемость из Бара - ((wiki.yandex-team.ru/AndrejjKostjagin/YaBarLog/HostStat Описание данных)). Фактор ремапится.
1112
15
15Long
Long document (the longer the document, the greater the value of the factor).
TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE
FI_LONGgulingulin
Длинный документ (чем длиннее документ, тем больше значение фактора).
77
16
16TRhitw
Hitweigt is a variant of textual relevance, in which the weights of all hits are considered equal (i.e. no premiums for title and word proximity are taken into account). In this case the relevant hits must pass the constraints of the syntactic wizard, i.e. we can assume that the TRhitw factor is 0 if and only if SoftAndOk is 0
LegacyTR
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_REARR_USE, TG_NN_OVER_FEATURES_USE
FI_HIT_WEIGHTgulin,leogulin,leo
Hitweigt - вариант текстовой релевантности, в которой веса всех хитов считаются равными (т.е. не учитывают надбавки за title и за близость слов). При этом соответствующие хиты должны пройти ограничения синтаксического колдунщика, т.е. можно считать, что фактор TRhitw равен 0 тогда и только тогда, когда SoftAndOk равен 0
328
17
17LongQuery
The sum of the idf of the query words. The name does not reflect the essence: for example, for the query 'Gadyach' this factor will be greater than for the query 'Moscow Peter Yekaterinburg Samara'.
Query
TG_QUERY_ONLY, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_L3_OVERWRITE, TG_NN_OVER_FEATURES_USE
FI_LONG_QUERYgulingulin
Сумма idf слов запроса. Название не отражает суть: например, для запроса 'Гадяч' этот фактор будет больше, чем для запроса 'Москва Питер Екатеринбург Самара'.
198
18
18PureTextLong text without references.
TG_BINARY, TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE
FI_PURE_TEXTleotsimkha,leo
https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/LongText
Длинный текст без ссылок.
29
19
19RootIt's a muzzle.
TG_BINARY, TG_DOC, TG_STATIC, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE
FI_ROOTgulingulin,tsimkha
https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/Root
Это морда.114
20
22Geo
Indicates a match between the user's region and the site at the country level. The factor is binary: 1-match, 0-no-match. Based on ((wiki.yandex-team.ru/YandexSearch/SiteSiteCategorization/Geographic/UseSiteGeoclassification))
TG_DYNAMIC, TG_LOCALIZED_COUNTRY, TG_HOST, TG_BINARY, TG_DEPRECATED, TG_UNDOCUMENTED, TG_OFTEN_ZERO
FI_GEO
ark-kum,gulin,maslov
ark-kum,gulin,maslov
Означает совпадение региона пользователя и сайта на уровне стран. Фактор бинарный: 1-совпадает, 0-нет. Основан на ((wiki.yandex-team.ru/ЯндексПоиск/КлассификацияСайтовИСтраниц/Географическая/ИспользованиеВПоиске геоклассификации сайтов))
226
21
23
SubqueryThMatch
Matching thematic spectra of the query and the document. The subject of the query is the result of ((wiki.yandex-team.ru/EvgenijjKroxalev/subquery rules wizard SubquerySearch )) The subject of the document is taken from the Yandex catalog
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_THEME_CLASSIF, TG_UNDOCUMENTED, TG_L2, TG_DEPRECATED
FI_SUBQUERY_THEME_MATCH
abokov,ekrokhalev,gulin
gulin,lamo
Совпадение тематических спектров запроса и документа. Тематика запроса - результат работы ((wiki.yandex-team.ru/EvgenijjKroxalev/subquery правила колдунщика SubquerySearch )) Тематика документа берется из яндекс-каталога
238
22
24SR
A complex static rank, assembled from static components using a separate formula ((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/#oftnd1 *)).
TG_DOC, TG_STATIC, TG_TRANS, TG_UNDOCUMENTED, TG_UNUSED
FI_SRgulin,somovgulin,somov
Сложносоставной static rank, собирается из статических компонентов по отдельной формуле((wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/#oftnd1 *)).
179
23
25TRref
Factor about the number of refines. The query language has a user refines ('word preceded by a percent sign') feature. This is supposed to mean something like 'it would be nice to have a word in the document'. The only known ((http://staff.yandex-team.ru/gulin Andrey Gulin)) valuable use of this feature is querying [%official %site FirmName]. This feature is unknown to users, since it is not described in any documentation. It is planned that it will disappear from the query language, but the words with USER_REFINE priority will remain in the wizard. The factor tells you how many maximum USER_REFINE words were encountered simultaneously within a single quorum hit. It is said to be between 0 and 3 (if >3, it is said to be 3). This number is mapped to the half-interval [0,1)
LegacyTR
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE
FI_REFINESgulin,leogulin,leo
Фактор про число refines. В языке запросов есть фича user refines ('слово, перед которым стоит знак процентика'). По задумке это означает что-то вроде 'хорошо бы, чтобы слово в документе было'. Единственное известное ((http://staff.yandex-team.ru/gulin Андрей Гулин)) ценное использование данной фичи - это запрос [%официальный %сайт НазваниеФирмы]. Пользователям данная фича неизвестна, т.к. не описана ни в какой документации. Планируется, что она исчезнет из языка запросов, но в колдунщике слова с приоритетом USER_REFINE останутся. Фактор говорит о том, сколько максимум USER_REFINE-слов одновременно встречалось в рамках единого попадания в кворум. Считается, что их от 0 до 3 (если >3, то считается, что 3). Это число мапится в полуинтервал [0,1)
782
24
26TRboost
The number by which some link factors (namely, factors number 6, 7, 47, 66) are multiplied if the text relevance is 0 and there are few links
Dynamic
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE
FI_TR_BOOSTgulingulin
Число, на которое умножаются некоторые линковые факторы (именно, факторы номер 6, 7, 47, 66), если текстовая релевантность 0, и ссылок мало
141
25
27TRLRlemmaIn textual relevance, a lemma match occurred.Dynamic
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_SAMOHOD_UNIMPLEMENTED, TG_CALLISTO_UNIMPLEMENTED, TG_NN_OVER_FEATURES_USE
FI_TRLR_LEMMAgulin,leogulin,leo
В текстовой релевантности произошло совпадение леммы.
45
26
28
TrafgraphOutAll_share_d
Remapped mascot feature TrafgraphOutAll_share_d
SEARCHSPAM-15531
TG_OWNER, TG_STATIC, TG_OFTEN_ZERO, TG_COMMERCIAL, TG_NN_OVER_FEATURES_USE
FI_TRAFGRAPH_OUT_ALL_SHARE_D
bikulov
bikulov,sdormidontov
2020-09-30
Remapped mascot feature TrafgraphOutAll_share_d
47
27
29
RelevSentsDssm
Dssm model, trained on reformulations, uses relevant sentences in the document part
FACTOR-2259
TG_DYNAMIC, TG_DOC, TG_DOC_TEXT, TG_NEURAL, TG_NN_OVER_FEATURES_USE
FI_RELEV_SENTS_DSSM
padesepadese2020-03-03
DssmRelevSents
Dssm модель, обучена на переформулировки, в документной части использует релевантные запросу предложения
83
28
30
FreshNewsDetectorPredict
The value of the news detector calculated in behemoth. Always 0 when the detector value is less than the threshold.
WEBFRESH-478
TG_DYNAMIC, TG_QUERY_ONLY, TG_USER, TG_FRESHNESS_USE, TG_L2, TG_QUERY_DETECTOR_PREDICT, TG_UNUSED, TG_NOT_01
FI_FRESH_NEWS_DETECTOR_PREDICT
alejes,hyggealejes,hygge2020-09-27-3.00E+383.00E+38
Значение детектора новостей, рассчитываемого в бегемоте. Всегда 0 при значении детектора меньше порога.
115
29
31LRHitNum100The converted number of query words in all url links.LegacyLR
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED
FI_HIT_NUM_100
leshchalsafr
Преобразованное количество слов запроса во всех линках url`а.
53
30
32LRHitNumGt16
The document LR>20 has the number of occurrences of the query words in the links > 16, factor about LR.
LegacyLR
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_DEPRECATED
FI_HIT_NUM_GT_16
leshchalsafr
У документа LR>20 количество вхождение слов запроса в линках > 16, фактор про LR.
103
31
33PctLinks
For documents with high LR - normalized link relevance without regard to proximity, for documents with low LR 0
LegacyLR
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED
FI_PCT_LINKSleshchalsafr
Для документов с высокой LR - нормированная линковая релевантность без учета близости, для документов с низкой LR 0
111
32
34HasLRUrl high LR.LegacyLR
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED
FI_HAS_LRdenplusplusalsafrUrl высокую LR.12
33
35LinkQuality
Quality of incoming references (Leschiner's classifier) - broken, see [405]
TG_DOC, TG_LINK_TEXT, TG_STATIC, TG_DEPRECATED, TG_L2
FI_LINK_QUALITY
leshchalsafr
Качество входящих ссылок (классификатор Лещинера) - сломан, см [405]
75
34
36
AliceMusicTrackTitleCosineMatchMaxPrediction
CosineMatchMaxPrediction factor value for the AliceMusic stream
BUKI-2932
TG_UNUSED, TG_DYNAMIC, TG_DOC, TG_ALICE_MUSIC, TG_ANNOTATION_NOFILTER, TG_TEXT_MACHINE, TG_ALLOW_USE_FOR_ALICE
FI_ALICE_MUSIC_TRACK_TITLE_COSINE_MATCH_MAX_PREDICTION
anrodigina
anrodigina,gotmanov,hommforever
2020-03-11
https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/lingboost
Значение фактора CosineMatchMaxPrediction для стрима AliceMusic
63
35
37NumLinksNumber of incoming links. Remaps.
TG_DOC, TG_LINK_GRAPH, TG_STATIC, TG_L2, TG_UNUSED
FI_NUM_LINKStsimkha,alsafr
https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/NumLinks
Число входящих ссылок. Ремапится.
33
36
38PopularQPopularity of the requestQueryPopularQ
begemot_query_factors
TG_DYNAMIC, TG_QUERY_ONLY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_REARR_USE, TG_L2, TG_DEPRECATED
FI_POPULAR_Qdenplusplusdiver,akhropov
https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/PopularQ
Популярность запроса
25
37
39TRUnmapped
TR divided by the cube of the number of words in the query and converted by the standard remapTR.
LegacyTR
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE
FI_TR_UNMAPPED
denplusplus,gulin
alsafr,gulin
TR деленный на куб количества слов в запросе и преобразованный стандартным remapTR.
97
38
40RusLangThe language of the document is Russian.
TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE
FI_RUS_LANG
aalekseev,denplusplus
alsafr
Язык документа - русский.
40
39
41AddTime
Time of page addition, more is an older document; put the root of the time mapped to the interval -[0,1] so that 3+ years gives 1-
TG_DATE, TG_DOC, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_ADD_TIME
aalekseev,denplusplus
alsafr
Время добавления страницы, больше - более старый документ; кладется корень из времени, отображенный на интервал -[0,1] так, чтобы 3+ года давало 1-
130
40
42IsMainPage
If the main page of the owner (most often a second-level domain, such as xxxx.ru), the factor is 1. For bomzhatniki, hosting, personal blogs, etc. (eg, Lyfjornal, narod.ru, etc.) - third-level domains (such as xxxxx.narod.ru) will also have a factor of 1.
TG_DOC, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE
FI_IS_MAIN_PAGE
aalekseev,denplusplus
alsafr
Если главная страница владельца (чаще всего домен второго уровня, например xxxx.ru), то фактор равен 1. Для бомжатников, хостингов, личных блогов и т.д. (например, лайфджорнал, народ.ру и пр.) - домены третьего уровня (типа xxxxx.narod.ru) так же будут иметь фактор равный 1.
255
41
43AddTimeMP
The owner (host?) main page addition time, remaps in the same way as AddTime.
TG_DATE, TG_HOST, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_ADD_TIME_MP
aalekseev,denplusplus
alsafr
Время добавления главной страницы владельца (хоста?), ремапится так же, как AddTime.
177
42
44
AliceMusicTrackTitleAnnotationMaxValueWeighted
The value of the AnnotationMaxValueWeighted factor for the AliceMusic streamer
BUKI-2932
TG_UNUSED, TG_DYNAMIC, TG_DOC, TG_ALICE_MUSIC, TG_ANNOTATION_NOFILTER, TG_TEXT_MACHINE, TG_ALLOW_USE_FOR_ALICE
FI_ALICE_MUSIC_TRACK_TITLE_ANNOTATION_MAX_VALUE_WEIGHTED
anrodigina
anrodigina,gotmanov,hommforever
2020-03-11
https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/lingboost
Значение фактора AnnotationMaxValueWeighted для стрима AliceMusic
78
43
45
QueryURLClicksPCTR
How often the URL is clicked on this query - CTR multiplied by the correction factor
CNT_RELEV
TG_DYNAMIC, TG_DOC, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATED
FI_URL_CLICKS_PCTR
akhropov,solartarum,niknik
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#queryurldownerclickspctrfrccomboreg
Насколько часто кликают в данный URL по данному запросу - CTR домноженный на поправочный коэффициент
0.684
44
46TextBM25Simple BM25 by text.TextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_BM25gulingulin
Простой BM25 по тексту.
20
45
47LinkBM25Simple BM25 by links, link weights are not taken into account.
LinkBM25 & Dynamic
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_DEPRECATED
FI_LINK_BM25gulingulin
Простой BM25 по линкам, веса линков не учитываются.
62
46
48TLBM25Simple BM25 by text and links at the same time.
TextAndLinkBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_L2, TG_DEPRECATED
FI_TLBM25gulingulin
Простой BM25 по тексту и линкам одновременно.
47
47
49TLp1All query words are in the text + links.
TextAndLinkBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_L2, TG_DEPRECATED
FI_TLP1gulingulin
Все слова запроса есть в тексте + линках.
40
48
50AdvThere are ads on the site.
TG_OWNER, TG_STATIC, TG_BINARY, TG_DEPRECATED, TG_OFTEN_ZERO
FI_ADV
aalekseev,denplusplus
sisoid,alsafr
На сайте есть реклама.
26
49
51YandexAdvThere are Yandex ads on the site.
TG_OWNER, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_DEPRECATED, TG_OFTEN_ZERO
FI_YANDEX_ADV
aalekseev,denplusplus
sisoid,alsafr
На сайте есть реклама Яндекса.
133
50
52NoSpam
Spam classifier by anti-spam chips recognized the site as NOT(!) spam. I.e. 0=spam, 1=good.
TG_OWNER, TG_STATIC, TG_THEME_CLASSIF, TG_REARR_USE, TG_DEPRECATED
FI_NO_SPAM
aalekseev,denplusplus
alsafr
Классификатор спама по фичам из антиспама признал сайт НЕ(!) спамом. Т.е. 0=спам, 1=хороший.
191
51
53TxtPair
Simple BM25 by word pairs - we take all pairs of query words and count the number of their occurrences in the text of the document. We use sum of word weights as pair weight. Comm Doesn't work if query has stop word
TextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_PAIRgulingulin
Простой BM25 по парам слов - берем все пары слов запроса и считаем число их вхождений в текст документа. В качества веса пары используем сумму весов слов. Комм Не работает, если в запросе есть стоп-слово
215
52
54LnkPair
Same as TxtPair, but for links; link weights are not taken into account.
LinkBM25
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_L2, TG_DEPRECATED
FI_LINK_PAIRgulingulin
То же, что TxtPair, но для линков; веса линков не учитываются.
72
53
55TxtBreak
BM25 from the number of sentences in the document in which it occurs.
TextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_BREAKgulingulin
BM25 от количества предложений в документе, в которых встречается.
69
54
56TxtHeadBM25 by the words in the title only.TextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_HEADgulingulin
BM25 по словам только в заголовке.
36
55
57TxtHiRel
BM25 on words only with high rel bits ('significant', with highlighting (<b>, etc.)).
TextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_HI_RELEV
gulingulin
BM25 по словам только с high rel-битиками ('значимым', с выделением (<b> итп)).
85
56
59WordCountMin(number of query words/10, 1.f)Query
TG_QUERY_ONLY, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_WORD_COUNT
denplusplus,gulin
alsafr,gulin
Min(число слов запроса/10, 1.f)
34
57
60InvWordCount1 / number_words_in_request.Query
TG_DYNAMIC, TG_QUERY_ONLY, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_INV_WORD_COUNT
denplusplus,gulin
alsafr,gulin
1 / количество_слов_в_запросе.
28
58
61HasNoTRThe document has no TR.LegacyTR
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE
FI_HAS_NO_TR
denplusplus,gulin
alsafr,gulin1
У документа нет TR.
23
59
62HasNoLRThe document has no LR.LegacyLR
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED
FI_HAS_NO_LR
denplusplus,gulin
gulin,alsafr1
У документа нет LR.
23
60
63
HasNoQueryURLShows
There is no information about clickability for this url for this request 1 - request or request-url is not in the clickbase, 0 - request-url is in the clickbase
CNT_RELEV
TG_DYNAMIC, TG_DOC, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_BINARY, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATED
FI_HAS_NO_QUERY_URL_SHOWS
denplusplus,kostyagin
tarum,niknik1
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#hasnoqueryurldownershows
Для данного урла для данного запроса нет информации о кликабельности 1 - запроса или запроса-urla нет в базе кликов, 0 - запрос-url есть в базе кликов
1160
61
64
HasNoQueryShows
For this query there is no information about clickability 1 - the query is not in the clickbase, 0 - the query is in the clickbase.
CNT_RELEV
TG_DYNAMIC, TG_QUERY_ONLY, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_USER_SEARCH_EXTERNAL, TG_BINARY, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATED
FI_HAS_NO_QUERY_SHOWS
denplusplus,kostyagin,akhropov
tarum,niknik1
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#hasnoqueryshows
Для данного запроса нет информации о кликабельности 1 - запроса нет в базе кликов, 0 - запрос есть в базе кликов.
131
62
65Hops
The number of hops of the url in a roundtrip (like less - closer to the muzzle, the smaller the value (0 - muzzle, 1 - cannot be reached from the muzzle, 0 < can be reached from the muzzle < 1). Normal value for nost root is 0.0039).
TG_DOC, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_HOPSdenplusplusalsafr
Количество хопов урла в обходе (типа меньше - ближе к морде, тем меньше значение (0 - морда, 1 - с морды добраться нельзя, 0 < можно добраться с морды < 1). Нормальное значение для корня носта 0.0039).
233
63
66LogLRThe logarithm of LR, linearly mapped in [0,1]Dynamic
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED
FI_LOG_LR
denplusplus,karpik
alsafr
Логарифм от LR, линейно отображенный в [0,1]
0.8545
64
67TxtPairExpresence of word pairs in exact formTextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_PAIR_EX
alsafr
наличие пар слов по точной форме
36
65
68TxtBreakEx
the number of sentences in which there are many words in the exact form
TextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_BREAK_EX
alsafr
количество предложений, в которых встречается много слов по точной форме
71
66
69TxtHeadExthe presence of words in the title in the exact formTextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_HEAD_EX
alsafr
наличие слов в заголовке по точной форме
52
67
70TxtHiRelExBM25 in exact formTextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_HI_RELEV_EX
alsafr
BM25 по точной форме
18
68
71TxtBm25ExA simple BM25 in precise form.TextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_BM25_EX
alsafr
Простой BM25 по точной форме.
30
69
72TxtPairSypresence of word pairs with synonyms (>=TxtPair)TextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_PAIR_SYN
alsafr
наличие пар слов c учетом синонимов (>=TxtPair)
48
70
73TxtBreakSy
the number of sentences in which there are many words with synonyms taken into account
TextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_BRAEK_SYN
alsafr
количество предложений, в которых встречается много слов c учетом синонимов
86
71
74TxtHeadSy
the presence of words in the title, taking into account synonyms
TextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_REARR_USE, TG_NN_OVER_FEATURES_USE
FI_TEXT_HEAD_SYN
alsafr
наличие слов в заголовке c учетом синонимов
64
72
75TxtHiRelSyBM25 including synonymsTextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_HI_RELEV_SYN
alsafr
BM25 c учетом синонимов
23
73
76TxtBm25SySimple BM25 with synonyms in mind.TextBM25
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_BM25_SYN
alsafr
Простой BM25 c учетом синонимов.
34
74
77
QueryDOwnerClicksPCTR
How often the URLs of the given domainId are clicked on the given query - CTR domainId multiplied by the correction factor
CNT_RELEV
TG_DYNAMIC, TG_DOWNER, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_USER_SEARCH_EXTERNAL, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATED
FI_QUERY_DOWNER_CLICKS_PCTR
akhropov,solar,denplusplus
tarum,niknik
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#queryurldownerclickspctrfrccomboreg
Насколько часто кликают в URLы данного domainId по данному запросу - CTR domainId домноженный на поправочный коэффициент
122
75
78
HasNoQueryDOwnerShows
For this domainId for this query there is no information about clickability 1 - request or request-owner is not in the clickbase, 0 - request-owner is in the clickbase
CNT_RELEV
TG_DYNAMIC, TG_DOWNER, TG_LOCALIZED_COUNTRY, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_USER_SEARCH_EXTERNAL, TG_BINARY, TG_OFTEN_ZERO, TG_L2, TG_SAMOHOD_UNIMPLEMENTED, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATED
FI_HAS_NO_QUERY_DOWNER_SHOWS
denplusplus,kostyagin
tarum,niknik1
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/Клики#hasnoqueryurldownershows
Для данного domainId для данного запроса нет информации о кликабельности 1 - запроса или запроса-владельца нет в базе кликов, 0 - запрос-владелец есть в базе кликов
167
76
79
OwnerClicksPCTR
Clickability of the owner regardless of the request
TG_STATIC, TG_OWNER, TG_USER, TG_USER_SEARCH, TG_USER_SEARCH_ONLY, TG_USER_EXT_DATA, TG_OFTEN_ZERO, TG_L2, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_CLICKS_SHOWS, TG_FORMULA_2245_DEP_3, TG_DEPRECATED
FI_OWNER_CLICKS_PCTR
akhropov,maslovtarum,niknik
https://wiki.yandex-team.ru/ЯндексПоиск/КачествоПоиска/Клики#ownerclickspctrreg
Кликабельность владельца независимо от запроса
51
77
80Megafon
Relative frequency of query words in links (1 - query words often occur in links, 0.3 - rarely); more precisely, the value of this factor is pessimized if: TR=0 && LR=0 && (no links with all query words) && (no quorum) && (at least one pair of query words occurs in the text)
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_UNUSED
FI_MEGAFONalsafr
Относительная частота слов запроса в ссылках (1 - слова запроса часто встречаются в ссылках, 0.3 - редко); если точнее, значение этого фактора пессимизируется при условии: TR=0 && LR=0 && (нет ни одной ссылки со всеми словами запроса) && (не прошёл кворум) && (в тексте встречается хотя бы одна пара слов запроса)
275
78
81XLRp0The links have all the words of the queryXref
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED
FI_HAS_ALL_WORDS_MERGED
alsafr
В ссылках есть все слова запроса
41
79
82XLRp1One link has all the words of the queryXref
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED
FI_HAS_ALL_WORDS_IN_LINK
alsafr
В одной ссылке есть все слова запроса
39
80
83XLRp2There is a link that passed the quorumXref
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED
FI_PHRASEalsafr
Есть ссылка, прошедшая кворум
38
81
84XLRgoodWhat proportion of links are "good"Xref
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_REARR_USE, TG_UNDOCUMENTED, TG_DEPRECATED
FI_GOOD_RATIOalsafr
Какая доля ссылок “хорошая”
35
82
85XLRmanyBadHow many "bad" links (bad = dpr = 0)Xref
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED
FI_MANY_BADalsafr
Насколько много “плохих” ссылок (плохой = dpr = 0)
136
83
86XLRmaxDprMaximum dpr referenceXref
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED
FI_LR_MAX_DPRalsafr
Максимальный dpr ссылки
21
84
87XLRtfidf
TfIdf is usual TF*IDF by links. The word frequency in the references is multiplied by the inverse document frequency and summed over all words, then normalized to the document length.
Xref
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED
FI_LR_TF_IDFalsafr
TfIdf обычный TF*IDF по ссылкам. Частота слова в ссылках умножается на обратную документную частоту и суммируется по всем словам, потом нормируется на длину документа.
183
85
88XLRrelevLink relevance by GulinXref
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED
FI_LR_RELEVgulingulin
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/OpisanijaFaktorov#h20931-2
Линковая релевантность от Гулина
23
86
89XLRrelev200Link relevance by GulinXref
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED
FI_LR_RELEV_200
gulingulin
Линковая релевантность от Гулина
23
87
90XLRlogRelevLink relevance by GulinXref
TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED
FI_LR_LOG_RELEV
gulingulin
Линковая релевантность от Гулина
23
88
91BFexactThere is an exact form of all query words in the text/linksBestForm
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_DEPRECATED
FI_BF_EXACTalsafr
Есть точная форма всех слов запроса в тексте/линках
59
89
92BFlemmaThere is a lemma of all query words in the text/linksBestForm
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_LINK_TEXT, TG_BINARY, TG_UNDOCUMENTED, TG_DEPRECATED
FI_BF_LEMMAalsafr
Есть лемма всех слов запроса в тексте/линках
53
90
93SoftAndOk
The document passed softand by the syntax wizard's constraints. Only for documents with textual relevance. For single-word queries it is always 1.
Dynamic
TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE
FI_SOFT_AND_OK
alsafr
Документ прошел softand по ограничениям синтаксического колдунщика. Только для документов, имеющих текстовую релевантность. Для однословных запросов всегда 1.
146
91
94NewLinkQualityIncoming link quality classifier 2 - broken, see [407]
TG_DOC, TG_LINK_GRAPH, TG_STATIC, TG_DEPRECATED
FI_NEW_LINK_QUALITY
alsafr
Классификатор качества входящих ссылок 2 - сломан, см [407]
54
92
95Ukrainian
equals one if the site has a Ukrainian geo-attribute (ie, 1 - Ukrainian site)
TG_STATIC_REGINFO, TG_HOST, TG_STATIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE
FI_UKRalsafr
равен единице, если у сайта стоит украинский гео-атрибут(т.е 1 - украинский сайт)
77
93
96IsBlogBloghosting page
TG_HOST, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE
FI_IS_BLOGburmisha,zudinaburmisha,zudina
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-5
Страница с блогохостинга
16
94
97IsLivejournalPage from livejournal.com
TG_HOST, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE
FI_IS_LJalsafr
Страница с livejournal.com
25
95
99Spam2
Alexeyev's automatic spam classifier, probability that the site is spam (0 not spam, 1-spam)
TG_OWNER, TG_STATIC, TG_THEME_CLASSIF, TG_DEPRECATED
FI_SPAM2abvabv
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/OpisanijaFaktorov#h20931-3
Автоматичемкий классификатор спама им. Алексеева, вероятность того, что сайт спам (0 не спам, 1- спам)
192
96
100TextFeatures
Text quality. Calculated according to a rather complicated formula
TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_FEATURES
alsafr
Качество текста. Считается по довольно сложной формуле
66
97
101TextLikeText quality (Alekseev's classifier)
TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE
FI_TEXT_LIKEalsafr
Качество текста (классификатор Алексеева)
36
98
104YaBarCoreOwnerThe core audience of owners according to Yandex.Browsing
TG_STATIC, TG_OWNER, TG_USER, TG_BROWSER, TG_L2, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_VISITS_ACTIVITY_DOWNLOADS
FI_YABAR_CORE_OWNER
monstertarum,niknik
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/userbrowsingactions/coreaudience/
Ядро аудитории владельцев по данным Яндекс.Браузинга
56
99
105YaBarCoreHostHost audience kernel according to Yandex.Browsing
TG_STATIC, TG_HOST, TG_USER, TG_BROWSER, TG_REARR_USE, TG_L2, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_VISITS_ACTIVITY_DOWNLOADS
FI_YABAR_CORE_HOST
kostyagintarum,niknik
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/userbrowsingactions/coreaudience/
Ядро аудитории хостов по данным Яндекс.Браузинга
49
100
106HasYaBarCoreDoes the host have a kernel
TG_STATIC, TG_HOST, TG_USER, TG_BROWSER, TG_BINARY, TG_OFTEN_ZERO, TG_L2, TG_USERFEAT, TG_USERFEAT_90D, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_VISITS_ACTIVITY_DOWNLOADS
FI_HAS_YA_BAR_CORE
kostyagintarum,niknik
https://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/userbrowsingactions/coreaudience/
Имеет ли хост ядро
127