[search] Avoid fancy categories matching. #4276
No reviewers
Labels
No labels
Accessibility
Accessibility
Address
Address
Android
Android
Android Auto
Android Auto
Android Automotive (AAOS)
Android Automotive (AAOS)
API
API
AppGallery
AppGallery
AppStore
AppStore
Battery and Performance
Battery and Performance
Blocker
Blocker
Bookmarks and Tracks
Bookmarks and Tracks
Borders
Borders
Bug
Bug
Build
Build
CarPlay
CarPlay
Classificator
Classificator
Community
Community
Core
Core
CrashReports
CrashReports
Cycling
Cycling
Desktop
Desktop
DevEx
DevEx
DevOps
DevOps
dev_sandbox
dev_sandbox
Directions
Directions
Documentation
Documentation
Downloader
Downloader
Drape
Drape
Driving
Driving
Duplicate
Duplicate
Editor
Editor
Elevation
Elevation
Enhancement
Enhancement
Epic
Epic
External Map Datasets
External Map Datasets
F-Droid
F-Droid
Fonts
Fonts
Frequently User Reported
Frequently User Reported
Fund
Fund
Generator
Generator
Good first issue
Good first issue
Google Play
Google Play
GPS
GPS
GSoC
GSoC
iCloud
iCloud
Icons
Icons
iOS
iOS
Legal
Legal
Linux Desktop
Linux Desktop
Linux packaging
Linux packaging
Linux Phone
Linux Phone
Mac OS
Mac OS
Map Data
Map Data
Metro
Metro
Navigation
Navigation
Need Feedback
Need Feedback
Night Mode
Night Mode
NLnet 2024-06-281
NLnet 2024-06-281
No Feature Parity
No Feature Parity
Opening Hours
Opening Hours
Outdoors
Outdoors
POI Info
POI Info
Privacy
Privacy
Public Transport
Public Transport
Raw Idea
Raw Idea
Refactoring
Refactoring
Regional
Regional
Regression
Regression
Releases
Releases
RoboTest
RoboTest
Route Planning
Route Planning
Routing
Routing
Ruler
Ruler
Search
Search
Security
Security
Styles
Styles
Tests
Tests
Track Recording
Track Recording
Translations
Translations
TTS
TTS
UI
UI
UX
UX
Walk Navigation
Walk Navigation
Watches
Watches
Web
Web
Wikipedia
Wikipedia
Windows
Windows
Won't fix
Won't fix
World Map
World Map
No milestone
No project
No assignees
1 participant
Due date
No due date set.
Dependencies
No dependencies set.
Reference: organicmaps/organicmaps-tmp#4276
Loading…
Add table
Reference in a new issue
No description provided.
Delete branch "vng-fix"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
organicmaps/organicmaps#3655
Т.е. кошерная реализация могла бы фуззить только +-1 символ в именах объектов (ожидаемо, там где юзеры часто ошибаются, особенно на незнакомых языках), а для категорий делать только подсказку синих, возможно имевшихся ввиду синонимов, да и то, только если не было полнонго матча на хотя бы одну категорию. При этом можно жирным и не жирным подсвечивать очепятки в подсказках.
Running world_feed_tests.cpp::Transit_GTFS_ProjectStopToLine_Simple
FAILED
world_feed_tests/world_feed_tests.cpp:237 TEST(ResT(5, false) == PrepareNearestPointOnTrack(point_C, std::nullopt, shape.size() , Direction::Backward, shape)) (5, 0) (6, 0)
Это не идеальный, но в целом приемлемый фикс. Лучше примеры нерабочих запросов для предметного обсуждения.
Тут я еще буду экспериментировать с lower bound threshold, какие результаты уже не стоит показывать в search-in-viewport.
Еще можно заполнять dfa для категорий, если производные в свою очередь не являются тоже категориями. Так вроде логичнее, но код станет более заковыристым ..
Верно. Но про подсказки в списке ты согласен?
И в списке, и на карте не должно быть никаких фуззи результатов по "похожим в написании" категориям. Вообще. 0. Не зависимо от длины слова. Если ты с этим утверждением не согласен, то объясни почему, желательно, с реальными и полезными примерами. Моё мнение — если в результатах пусто, то взгляд идёт на запрос, и человек его исправляет на правильный. Вместо того, чтобы тыкать/скроллить что-то "похожее" на разных языках.
Дополнительный бонус от "пусто в результатах" — мы там сейчас будем подсказывать человеку про ОСМ и про как пользоваться поиском.
У нас не будет далеко. К сожалению, наш список короткий, всего 20 результатов. В этом тоже большая проблема.
Сложно формализовать в алгоритм +-1 символ? Моё пояснение было не про алгоритм, а про пользу +-1.
И почему один символ "очевидно" мало? Этого вполне достаточно для большинства кейзов, и мусора тоже будет уже достаточно.
Ты выбрал несколько отрепорченных пользователями ошибок. А сколько ещё не зарепорченных? Прогони алгоритм по categories.txt с разными языками, и сам увидишь, где уже +-1 вызывает коллизию, не говоря про +-2.
Повторюсь, на мой взгляд фуззи категории — никакие не нужно показывать, ни во вьюпорте, ни в списке. Только их в виде синих подсказок в списке, чтобы пользователь явно тыкнул, что он хотел, не глядя на опечатку. Так ты действительно поможешь пользователю.
Буду рад услышать веские аргументы, почему фуззи категории таки стоит показывать во вьюпорте и в списке.
Это о чём? Пояснишь?
Мне непонятно почему ты так настаиваешь, что категории прям никак не должны матчится с ошибками. Категории могут быть в запросе не сами по себе, а в контексте вместе с именами и улицами. Тут никакой подсказкой не решится. И да, я например пишу "ветеринар" с ошибками :)
"Еще можно заполнять dfa для категорий, если производные в свою очередь не являются тоже категориями."
это лучше решает вот это
"Прогони алгоритм по categories.txt с разными языками, и сам увидишь, где уже +-1 вызывает коллизию, не говоря про +-2."
Обсудили оффлайн.
Fuzzy categories нужны для двух случаев: