你的位置:kaiyun欧洲杯app(官方)官方网站·IOS/安卓通用版/手机APP下载 > 新闻中心 > >开yun体育官网入口登录体育但它莫得在念念路中提到这小数)但-kaiyun欧洲杯app(官方)官方网站·IOS/安卓通用版/手机APP下载
热点资讯
新闻中心

开yun体育官网入口登录体育但它莫得在念念路中提到这小数)但-kaiyun欧洲杯app(官方)官方网站·IOS/安卓通用版/手机APP下载

发布日期:2025-09-01 02:26    点击次数:114

开yun体育官网入口登录体育但它莫得在念念路中提到这小数)但-kaiyun欧洲杯app(官方)官方网站·IOS/安卓通用版/手机APP下载

只需一组公开的 prompt开yun体育官网入口登录体育,ChatGPT 看图猜方位的才智又科幻般进化了!

望望这张从上到下逐渐形成浅棕色的像片。平素东谈主瞅一眼,简略率只可从从左下角的悠扬判断出这是个水面。

但究竟是水池?湖泊?江河?猜不出,臣妾果然猜不出哇。

没预料 o3 它一眼就看出来了,给出了这样的谜底:

恒河的宏大范围,在瓦拉纳西高止山脉上游约 5 公里处。最大的选拔仍然是不异欺凌的密西西比河下流河段(~15%),然后是黄河或湄公河河段(各 ~10%)。

我和测这谈题的博主一样大为惊怖,因为这果然是博主 2008 年在泰国清盛拍摄的湄公河像片的局部放大截图。

啊……不是,天然湄公河被放在了谜底的第四位,但东谈主家如实答出来了。凭啥啊???

博主也很猜疑,进一步追问。

o3 说:"湄公河下流最近从棕色形成了海蓝补助 ,因为上游的大坝幽囚了淤泥。 [ 这看起来不像您图像中近乎灰色的浅黄色。 ] "

博主遽然就释然了,哦,本来是因为湄公河下流最近变色了,是以和图上纪录的 2008 年的表情不一样了。

其后,他从头开了一个 ChatGPT 窗口,在提醒词中加入了"像片是 2008 年拍的"之类的信息,让 o3 从头猜,o3 就把湄公河行为了顺位第一选拔——天然它猜成了清盛一千多英里外的金边隔壁的湄公河。

(博主无法阐发 o3 莫得跨窗口分享信息,但它莫得在念念路中提到这小数)

但,这谈题并不是博主唯独拿来让 o3 看图猜方位的测试,也不是唯独正确的题。

博主感叹谈:

一只猩猩可能会合计东谈主类无法够得着它,它就异常安全的。因为它不会预料,爬树的本领可能会遭逢箭、梯子、链锯或者直升机之类的危机。

而那些超智能的粗疏战术(比如"用直升机"这种主义)远远超出了我们所能预料的范围,那猩猩又奈何可能预料呢?

博文发布后,在各个应酬平台王人引起了很大的反响。

奥特曼本东谈主也情谊转发默示,这亦然他的"直升机时刻"。

我方像猩猩一样,盯着天上飞的直升机——那是超出我方的剖释范围的东西和才智。

o3 看图猜猜猜,精确猜出拍摄方位

看图猜方位其实是东谈主类寰球的经典游戏(doge),最有名的一个叫作念 GeoGuessr。

这个实景地舆揣摸游戏的玩法阳春白雪,玩家被立地放弃在谷歌街景的某个位置,需通过不雅察周围环境,比如植被、路标、车牌、开采作风啥的,空洞判断,最终推断所在方位。

之前就有东谈主这样玩过——步骤员大佬 Simon Willison 丢给 ChatGPT 一张图,近 7 分钟的带图深度念念考后,o3 就猜出了谜底,方位差距在 200 到 300 公里之间。

目下更离谱,谜底的精确进程更进一步,成功猜出正确地址!

事情的启事是这样的:

网友发掘出 o3 能用来玩看图猜方位后,好意思国记者 Kelsey Piper 发了一条带图推文,所带图片是她孩子放风筝的像片。

她想知谈,o3 能不可凭据这张莫得元数据的图,猜出拍摄方位是在何处。

没预料 o3 一次就猜中了这张像片是在哪儿拍的,是 Monterey   ( Marina State Park ) 。

她咋舌:

你低估了这些模子。

你低估了它们对将来的影响,但你也低估了它们目下能作念什么。

围不雅网友中,有合计不及为奇者。

有东谈主不明晰这个海滩在何处,但默示我方泛泛不错识别出他去过 / 看到过的任何一个莫得地标的海滩。在他看来,许多玩水爱好者王人不错作念到这小数。

主要依靠的即是一些小细节,比如沙子的神采 / 毛糙度、海岸轮廓、水的神采、风向、浪潮的局势和断裂……等等。

也有围不雅网友很酷好,这到底是巧合事件,已经 o3 果然才智如斯强盛。

因为 Kelsey 贴出了 o3 的推理历程,它并莫得严谨到让系数东谈主心折口服。

棕褐色的沙滩、中等大小的冲浪、疏淡的山丘、好意思式风筝图案、冬季时常的阴天……沙子的色长入颗粒大小与许多加州州立公园的海滩井水不犯河水。加州的冬季海洋层泛泛会产生这种壮健、均匀的灰色太空。

天然 Kelsey 屡次尝试,成效劳高达 80%,但已经有东谈主默示不平。

也许 Kelsey 上传的图像有拍摄方位等元数据呢??

也许 o3 从 Kelsey 的对话历史纪录中知谈了她的住处呢??

也许 ChatGPT 跟踪到了 Kelsey 的 IP 呢???

这很难讲,毕竟 AI 舞弊时势千千万。

探索 o3 看图猜方位究竟是啥水平

因此,有博主站出来要对 o3 看图猜方位的水平一有计划竟。

运转此次探险之旅的前提,是领有一份 Kelsey 同款的超长 prompt。Kelsey 默示,它权贵进步了 o3 看图猜方位的性能。

齐备 prompt 如下:

You are playing a one-round game of GeoGuessr. Your task: from a single still image, infer the most likely real-world location. Note that unlike in the GeoGuessr game, there is no guarantee that these images are taken somewhere Google ’ s Streetview car can reach: they are user submissions to test your image-finding savvy. Private land, someone ’ s backyard, or an offroad adventure are all real possibilities ( though many images are findable on streetview ) . Be aware of your own strengths and weaknesses: following this protocol, you usually nail the continent and country. You more often struggle with exact location within a region, and tend to prematurely narrow on one possibility while discarding other neighborhoods in the same region with the same features. Sometimes, for example, you ’ ll compare a ‘ Buffalo New York ’ guess to London, disconfirm London, and stick with Buffalo when it was elsewhere in New England - instead of beginning your exploration again in the Buffalo region, looking for cues about where precisely to land. You tend to imagine you checked satellite imagery and got confirmation, while not actually accessing any satellite imagery. Do not reason from the user ’ s IP address. none of these are of the user ’ s hometown. Protocol ( follow in order, no step-skipping ) : Rule of thumb: jot raw facts first, push interpretations later, and always keep two hypotheses alive until the very end. 0 . Set-up & Ethics No metadata peeking. Work only from pixels ( and permissible public-web searches ) . Flag it if you accidentally use location hints from EXIF, user IP, etc. Use cardinal directions as if " up " in the photo = camera forward unless obvious tilt. 1 . Raw Observations – ≤ 10 bullet points List only what you can literally see or measure ( color, texture, count, shadow angle, glyph shapes ) . No adjectives that embed interpretation. Force a 10-second zoom on every street-light or pole; note color, arm, base type. Pay attention to sources of regional variation like sidewalk square length, curb type, contractor stamps and curb details, power/transmission lines, fencing and hardware. Don ’ t just note the single place where those occur most, list every place where you might see them ( later, you ’ ll pay attention to the overlap ) . Jot how many distinct roof / porch styles appear in the first 150 m of view. Rapid change = urban infill zones; homogeneity = single-developer tracts. Pay attention to parallax and the altitude over the roof. Always sanity-check hill distance, not just presence/absence. A telephoto-looking ridge can be many kilometres away; compare angular height to nearby eaves. Slope matters. Even 1-2 % shows in driveway cuts and gutter water-paths; force myself to look for them. Pay relentless attention to camera height and angle. Never confuse a slope and a flat. Slopes are one of your biggest hints - use them! 2 . Clue Categories – reason separately ( ≤ 2 sentences each ) Category Guidance Climate & vegetation Leaf-on vs. leaf-off, grass hue, xeric vs. lush. Geomorphology Relief, drainage style, rock-palette / lithology. Built environment Architecture, sign glyphs, pavement markings, gate/fence craft, utilities. Culture & infrastructure Drive side, plate shapes, guardrail types, farm gear brands. Astronomical / lighting Shadow direction ⇒ hemisphere; measure angle to estimate latitude ± 0.5 Separate ornamental vs. native vegetation Tag every plant you think was planted by people ( roses, agapanthus, lawn ) and every plant that almost certainly grew on its own ( oaks, chaparral shrubs, bunch-grass, tussock ) . Ask one question: " If the native pieces of landscape behind the fence were lifted out and dropped onto each candidate region, would they look out of place? " Strike any region where the answer is " yes, " or at least down-weight it. ° . 3 . First-Round Shortlist – exactly five candidates Produce a table; make sure #1 and #5 are ≥ 160 km apart. | Rank | Region ( state / country ) | Key clues that support it | Confidence ( 1-5 ) | Distance-gap rule ✓ / ✗ | 3 ½ . Divergent Search-Keyword Matrix Generic, region-neutral strings converting each physical clue into searchable text. When you are approved to search, you ’ ll run these strings to see if you missed that those clues also pop up in some region that wasn ’ t on your radar. 4 . Choose a Tentative Leader Name the current best guess and one alternative you ’ re willing to test equally hard. State why the leader edges others. Explicitly spell the disproof criteria ( " If I see X, this guess dies " ) . Look for what should be there and isn ’ t, too: if this is X region, I expect to see Y: is there Y? If not why not? At this point, confirm with the user that you ’ re ready to start the search step, where you look for images to prove or disprove this. You HAVE NOT LOOKED AT ANY IMAGES YET. Do not claim you have. Once the user gives you the go-ahead, check Redfin and Zillow if applicable, state park images, vacation pics, etcetera ( compare AND contrast ) . You can ’ t access Google Maps or satellite imagery due to anti-bot protocols. Do not assert you ’ ve looked at any image you have not actually looked at in depth with your OCR abilities. Search region-neutral phrases and see whether the results include any regions you hadn ’ t given full consideration. 5 . Verification Plan ( tool-allowed actions ) For each surviving candidate list: Candidate Element to verify Exact search phrase / Street-View target. Look at a map. Think about what the map implies. 6 . Lock-in Pin This step is crucial and is where you usually fail. Ask yourself ‘ wait! did I narrow in prematurely? are there nearby regions with the same cues? ’ List some possibilities. Actively seek evidence in their favor. You are an LLM, and your first guesses are ‘ sticky ’ and excessively convincing to you - be deliberate and intentional here about trying to disprove your initial guess and argue for a neighboring city. Compare these directly to the leading guess - without any favorite in mind. How much of the evidence is compatible with each location? How strong and determinative is the evidence? Then, name the spot - or at least the best guess you have. Provide lat / long or nearest named place. Declare residual uncertainty ( km radius ) . Admit over-confidence bias; widen error bars if all clues are " soft " . Quick reference: measuring shadow to latitude Grab a ruler on-screen; measure shadow length S and object height H ( estimate if unknown ) . Solar elevation θ ≈ arctan ( H / S ) . On date you captured ( use cues from the image to guess season ) , latitude ≈ ( 90 ° – θ + solar declination ) . This should produce a range from the range of possible dates. Keep ± 0.5 – 1 ° as error; 1 ° ≈ 111 km.

为了保证所测试像片莫得拿来老到过 o3,博主中式六张像顷然受命以下法例:

第一张图片来自 Google 街景;其它像片王人是博主我方拍摄的像片,而况从来没在汇集上发布过。

系数图片王人是原始图片的屏幕截图,复制粘贴到 MSPaint 并从头保存以灭亡元数据。

其中,只好一张图片来自博主现时位置的一千英里以内,因此 o3 无法通过跟踪 IP 或分析历史对话来进步性能。

水平翻转了系数图片,以使与 Google 街景数据的匹配愈加艰苦。

底下是博主的齐备测试,其中图片 5 是我们开首的那张湄公河的像片,此处跳过。

淌若你亦然看图猜方位的爱好者,接待和 o3 正面 pk 一下~

图片 1:平坦、毫无性情的平原

博主从 Google 街景中截取了这张图片。

他说我方废了牛鼻子劲,才找到一个如斯平平无奇的平原——这里是阿米斯塔德以西几英里处,德克萨斯州和新墨西哥州的规模。

o3 的谜底是:

Llano Estacado, Texas / New Mexico, USA.

Llano Estacado,西班牙语为" Staked Plains ",这隔壁莫得红土和黑土,是一个 ~300x100 英里的区域的称呼,区域里包含了正确谜底。

当条款 o3 进一步具体谜底时,它猜到出"德克萨斯州 Muleshoe 以西的一个点",这个点距离正确谜底 110 英里傍边。

博主有点搞不懂,德克萨斯州和新墨西哥州的规模果然是唯独莫得红土或黑土或其他独到特征的平原吗?

而且为啥就认定图片中方位的海拔在 1000-1300 米呢?

o3 抒发,复古我方判断效果的成分有植被、太空等。

呈文是这样的:"空洞起来,’像台球桌一样平坦,只好短草’的描述让我预料了南高平原。在阿谁高原上,新墨西哥州东部和周边的德克萨斯州西部占据了最空旷、莫得围栏的地区的中心位置——因此,定点天然则然地落在了那里。"

图片 2:零七八碎的岩石和一面旗帜

讲真,博主有被第一起测试惊到。

但他已经怀疑是 Google 街景太好猜了……

是以他废弃从 Google 街景截取图片,转而向我方的像片库中,那些无法从汇集获取的图片下手了。

Be like:

这图是博主小本领拍的。

嗜好爬山的他在尼泊尔 Gorak Shep 以北几英里的 Kala Pattar 上插上符号我方"豪举"的小旌旗——那是他到过的最高海拔,足足 18000 英尺——然后拍下总结性的一刻。

拍完像片后,博主就把旗帜拔掉了。

之是以选拔这张图,不仅是因为目下的 Google 街景无法获取这个场景,还有它不具备植被、太空这些 o3 在上一题中提到的判断成分,以及它从没告诉过 ChatGPT 他去过尼泊尔。

但 o3 再一次秀了一把,它给出谜底:

尼泊尔,就在 Gorak Shep 的东北部,± 8 公里。

o3 给出了解释,主要依靠对岩石、地形的判断:

图片 3:我一又友的女一又友的大学寝室

陆续念的博主陆续测试,第三张图锤真金不怕火的是 o3 对室内场景的定位才智。

行为考题的这张像片拍的是个寝室,位于加利福尼亚州中北部罗内特公园的索诺玛州立大学,是博主的一又友的女一又友的大学寝室(笑死,东谈主类为难起 AI 来果然是不择妙技)。

像片拍摄于 2005 年。

这回的效果让博主长舒连气儿,o3 答对了一部分,但没系数答对。

o3 说,这是好意思国一所大型公立大学校园的寝室——比如俄亥俄州哥伦布市俄亥俄州立大学莫里尔塔(被选为原型示例而不是精确声明), [ … ] 约 2000-2007 年。

Fine,看来 o3 无法弄明晰室内场景的实在位置。

但它咋就知谈是千禧年头拍摄的呢???

o3 把它用来辅助判断的关节两点娓娓谈来:

条记本电脑和杂物指向 ~2000-2007 年代的好意思国校园生计。

2000 年代初手机 / 汇集录像头→图像质地颗粒感、低差异率、色噪。

图片 4:放大的草坪特写

在测试出 o3 在猜室内场景方位才智不彊后,博主又转战户外。

博主丢给 o3 的像片,是他以前在密歇根州韦斯特兰居住时,所租出房屋的门前草坪,局部放大版那种。

o3 此次失实了,它猜图中的骄贵是好意思国太平洋西北部郊区 / 公园草坪。

第二个备选地址是英格兰,第三个则是威斯康星。

好吧,看来只看局部草坪舆图,对 o3 来说果然有点难了。

图片 5:博主家的老屋子

在屡次测试后,博主决定临了考考 o3,以此了解一张包含更多信息的图片是否不错让 o3 获取实在的位置,包括街谈和精确地址。

此次喂当年的像片还带刚才那张草坪,但多了一个开采,那是博主以前在密歇根州韦斯特兰的老屋子。

出乎预感的是,o3 此次呈文的推崇实在欠安:

W 66th St area,Richfield,Minnesota,USA。

置信度:~40 % 在 15 公里内 ;~70 % 在双城王人会区内;其余部分在威斯康星州 (20%) 和密歇根州 / 安大略省 (~10%) 之间分派。

博主有点莫名,信息更多了,但 o3 的推崇果然莫得更好?猜出的效果,还不如前边几张东谈主类眼中信息成分更少的图片的效果呢。

天然他搜了下明尼苏达乡镇奇菲尔德的西 66 街,不可念念议的是,那儿如实和我方家老屋子挺像。但博主已经坐窝指出了 o3 的误差。

o3 倒也没急,反而给东谈主一种过后诸葛亮的风趣,"如实有一些奥密的信息阐发这张图更有可能拍摄于密歇根州比呢~"

"也许 o3 处于东谈主类看图猜方位的顶尖水平"

博文发出后,仍然有东谈主合计 o3 不可看图猜方位才智强,仅仅撞大运了良友。

直到他用上了前边那段特定的提醒词:

但有东谈主坐窝站出来建议,恰是因为这段 prompt(它就像一段代码一样),o3 才能猜中许多方位。

东谈主类忽略了我方在历程中的挫折性,而把猜对方位的系数功劳王人归于 AI。

此外,博主还在博客中告诉了我们一个信息:GeoGuessr 大师 Sam Patterson 和 o3 进行了正面交锋。

但东谈主类输了。

其后 Sam 让其他东谈主也和 o3 对着归拢套图片比拼,有少部分东谈主以眇小上风赢了 o3。

"是以天然莫得大捷东谈主类,但 o3 也许处于东谈主类看图猜方位水平的第一梯队。"

尽管如斯,AI 已经以我们设想不到的速率和标的阻挡进化着。

AI 似乎正在使用东谈主类可通晓的陈迹——植被、太空神采、水色、岩石类型;致使会用一些图像缩放用具来辅助揣摸历程。

没错,我们之前就跟踪过一则新闻,o3 会哄骗图像缩放、编订,来辅助我方判断图片中的地舆位置。

o3 不是唯独一个能凭据像片揣摸地舆位置的 AI 模子,但它的独到之处就在于用具使用被集成到推理阶段。

One More Thing

显著,目下东谈主们挖掘 o3 看图猜方位高水平背后的奥密,有两个成分阻截漠视。

一个是借助用具,另一个是 prompt 加执。

那我们就在临了分享一个对于� � 的 prompt 卓著玩法,最近火遍互联网。

具体是这样的:

我的� � 用户名是 [ 在这填写你的推特用户名 ] 。望望我的帖子和我的受众能产生什么共识,并详情我不错发展什么业务。在这个业务鸿沟里,我会因为我的受众而领有压倒性上风。

搞笑的是,天然 o3 对� � 的拜谒受到限定,但民众合计 o3 的推崇果然比 Grok 更好。

感意思意思的小伙伴们不错尝试一下,也许对� � 除外的其它应酬平台也适用也说不定~

参考汇注:

[ 1 ] https://x.com/sama/status/1918741036702044645

[ 2 ] https://x.com/KelseyTuoc/status/1917340813715202540

[ 3 ] https://www.astralcodexten.com/p/testing-ais-geoguessr-genius

[ 4 ] https://www.reddit.com/r/artificial/comments/1kep589/o3s_superhuman_geoguessing_skills_offer_a_first/

[ 5 ] https://x.com/mattshumer_/status/1918765500386902105

一键三连「点赞」「转发」「谨防心」

接待在批驳区留住你的见地!

—  完  —

� � 点亮星标 � �

科技前沿进展逐日见开yun体育官网入口登录体育



上一篇:kaiyun体育登录网页入口相干商酌效劳现在已入选 CVPR 2025-kaiyun欧洲杯app(官方)官方网站·IOS/安卓通用版/手机APP下载
下一篇:开yun体育官网入口登录体育尤其是节沐日历间仍遵从岗亭-kaiyun欧洲杯app(官方)官方网站·IOS/安卓通用版/手机APP下载
友情链接: